L'API Parallel Task ha stabilito il nuovo standard di accuratezza su SealQA, un benchmark di sfida per LLM potenziati dalla ricerca. Su SEAL-0, il nostro livello Pro ottiene il 52,3% di accuratezza, il 35% in più rispetto a Perplexity Deep Research a un costo inferiore del 92%.