Nous avons développé la FACTS Benchmark Suite avec @GoogleResearch. 📊 C'est le premier test complet de l'industrie évaluant la factualité des LLM sur quatre dimensions : la connaissance interne du modèle, la recherche sur le web, le grounding et les entrées multimodales.