Мы разработали набор тестов FACTS Benchmark Suite совместно с @GoogleResearch. 📊 Это первый в отрасли комплексный тест, оценивающий фактическую точность LLM по четырем параметрам: внутренние знания модели, веб-поиск, привязка и мультимодальные входные данные.