Parallel Task API telah menetapkan standar baru untuk akurasi di SealQA, tolok ukur tantangan untuk LLM yang ditambah pencarian. Pada SEAL-0, tingkat Pro kami mendapat skor 52,3% pada akurasi, 35% lebih baik daripada Perplexity Deep Research dengan biaya 92% lebih rendah.