私たちは@GoogleResearchと共にFACTSベンチマークスイートを開発しました。📊 これは、内部モデル知識、ウェブ検索、グラウンディング、マルチモーダル入力の4つの次元でLLMの事実性を評価する業界初の包括的なテストです。