xAI 已将其快速、便宜、以代理为中心的模型升级到 Grok 4.1 Fast,在人工分析智能指数上跃升 +4 分 关键要点: ➤ 领先的代理性能:Grok 4.1 Fast 具备推理能力,在我们的 𝜏²-Bench 电信排行榜上以 93.3% 的得分位居首位,领先于 Kimi K2 Thinking,并比 Grok 4 Fast 提升了 +27 分 ➤ 智能帕累托前沿:与其前身一样,Grok 4.1 Fast 在低成本下提供领先的智能——在智能指数上仅比 Grok 4 低 1 分,且每个 token 的成本低约 30 倍。这使得 Grok 4.1 Fast 在我们的智能指数与成本比较中稳固地处于最具吸引力的象限 ➤ 明确的增量升级:除了这些针对代理和工具调用的改进外,Grok 4.1 Fast 保留了其前身的优势:低定价(每百万个输入/输出 token $0.2/0.5)、大上下文窗口(200 万个 token)和 token 效率 祝贺 @xai 团队和 @elonmusk 在此新版本发布上取得的成就! 请参见下文以获取进一步分析
Grok 4.1 Fast 在人工分析智能指数上获得了 64 分,比 Grok 4 高出 4 分,显然是对其前身的升级。
Grok 4.1 Fast 完成人工分析智能指数评估耗费了 7100 万个代币,成本为 45 美元,这与 Grok 4 相似,并且在这两个方面都显著低于大多数其他领先模型。
个别基准测试结果:MMLU-Pro,GPQA Diamond,人类的最后考试,LiveCodeBench,SciCode,AIME 2025,IFBench,AA-LCR,Terminal-Bench Hard,𝜏²-Bench Telecom
请查看我们的模型页面,以获取对Grok 4.1 Fast的性能、成本和能力的进一步分析。
55.6K