热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
xAI 已将其快速、便宜、以代理为中心的模型升级到 Grok 4.1 Fast,在人工分析智能指数上跃升 +4 分
关键要点:
➤ 领先的代理性能:Grok 4.1 Fast 具备推理能力,在我们的 𝜏²-Bench 电信排行榜上以 93.3% 的得分位居首位,领先于 Kimi K2 Thinking,并比 Grok 4 Fast 提升了 +27 分
➤ 智能帕累托前沿:与其前身一样,Grok 4.1 Fast 在低成本下提供领先的智能——在智能指数上仅比 Grok 4 低 1 分,且每个 token 的成本低约 30 倍。这使得 Grok 4.1 Fast 在我们的智能指数与成本比较中稳固地处于最具吸引力的象限
➤ 明确的增量升级:除了这些针对代理和工具调用的改进外,Grok 4.1 Fast 保留了其前身的优势:低定价(每百万个输入/输出 token $0.2/0.5)、大上下文窗口(200 万个 token)和 token 效率
祝贺 @xai 团队和 @elonmusk 在此新版本发布上取得的成就!
请参见下文以获取进一步分析

Grok 4.1 Fast 在人工分析智能指数上获得了 64 分,比 Grok 4 高出 4 分,显然是对其前身的升级。

Grok 4.1 Fast 完成人工分析智能指数评估耗费了 7100 万个代币,成本为 45 美元,这与 Grok 4 相似,并且在这两个方面都显著低于大多数其他领先模型。

个别基准测试结果:MMLU-Pro,GPQA Diamond,人类的最后考试,LiveCodeBench,SciCode,AIME 2025,IFBench,AA-LCR,Terminal-Bench Hard,𝜏²-Bench Telecom

请查看我们的模型页面,以获取对Grok 4.1 Fast的性能、成本和能力的进一步分析。
55.6K
热门
排行
收藏

