Kami telah mengembangkan FACTS Benchmark Suite dengan @GoogleResearch. 📊 Ini adalah tes komprehensif pertama di industri yang mengevaluasi faktualitas LLM di empat dimensi: pengetahuan model internal, pencarian web, pembumian, dan input multimodal.