Hemos desarrollado el FACTS Benchmark Suite con @GoogleResearch. 📊 Es la primera prueba integral de la industria que evalúa la factualidad de los LLM en cuatro dimensiones: conocimiento interno del modelo, búsqueda web, grounding y entradas multimodales.