Wir haben die FACTS Benchmark Suite zusammen mit @GoogleResearch entwickelt. 📊 Es ist der erste umfassende Test der Branche, der die Faktizität von LLMs in vier Dimensionen bewertet: internes Modellwissen, Websuche, Verankerung und multimodale Eingaben.