L'API Parallel Task a établi le nouveau standard d'exactitude sur SealQA, un benchmark de défi pour les LLMs augmentés par la recherche. Sur SEAL-0, notre niveau Pro obtient un score de 52,3 % en précision, soit 35 % de mieux que Perplexity Deep Research à un coût 92 % inférieur.