xAI 已經將其快速、便宜、以代理為中心的模型升級到 Grok 4.1 Fast,在人工分析智能指數上跳升了 +4 分 主要要點: ➤ 領先的代理性能:Grok 4.1 Fast 具備推理能力,在我們的 𝜏²-Bench 電信排行榜上以 93.3% 的得分位居首位,僅領先於 Kimi K2 Thinking,並且比 Grok 4 Fast 增加了 +27 分 ➤ 智能帕累托邊界:與其前身一樣,Grok 4.1 Fast 在低成本下提供領先的智能 - 它在智能指數上僅落後於 Grok 4 1 分,且每個標記的成本低約 30 倍。這使得 Grok 4.1 Fast 在我們的智能指數與成本比較中穩固地位於最具吸引力的象限 ➤ 明確的增量升級:除了這些對代理和工具調用的改進外,Grok 4.1 Fast 保留了其前身的優勢:低定價(每百萬個標記輸入/輸出 $0.2/0.5)、大上下文窗口(200 萬個標記)和標記效率 恭喜 @xai 團隊和 @elonmusk 在這次新版本發布上! 請參見下方的進一步分析
Grok 4.1 Fast 在人工分析智能指數上達到了 64 分,比 Grok 4 高出 4 分,顯示出它相對於前一版本的明顯升級。
Grok 4.1 Fast 完成人工分析智能指數評估耗費了 7100 萬個代幣,成本為 45 美元,與 Grok 4 相似,且在這兩方面都顯著低於大多數其他領先模型。
個別基準結果:MMLU-Pro、GPQA Diamond、人類的最後考試、LiveCodeBench、SciCode、AIME 2025、IFBench、AA-LCR、Terminal-Bench Hard、𝜏²-Bench Telecom
請查看我們的模型頁面,以進一步分析 Grok 4.1 Fast 的性能、成本和能力
55.6K