我们与 @GoogleResearch 开发了 FACTS 基准套件。 📊 这是业界首个全面评估 LLM 事实性的测试,涵盖四个维度:内部模型知识、网络搜索、基础和多模态输入。