Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
xAI đã nâng cấp mô hình nhanh, rẻ, tập trung vào tác nhân của họ lên Grok 4.1 Fast, tăng +4 điểm trên Chỉ số Trí tuệ Phân tích Nhân tạo
Những điểm chính:
➤ Hiệu suất tác nhân hàng đầu: Grok 4.1 Fast với khả năng lý luận đứng đầu bảng xếp hạng 𝜏²-Bench Telecom của chúng tôi với điểm số 93.3%, chỉ đứng trước Kimi K2 Thinking, và đại diện cho mức tăng +27 điểm so với Grok 4 Fast
➤ Đường biên Pareto trí tuệ: Giống như người tiền nhiệm của nó, Grok 4.1 Fast cung cấp trí tuệ hàng đầu với chi phí thấp - nó chỉ đứng sau Grok 4 1 điểm trên Chỉ số Trí tuệ với chi phí mỗi token thấp hơn khoảng 30 lần. Điều này đặt Grok 4.1 Fast vững chắc trong phần tứ giác hấp dẫn nhất của so sánh Chỉ số Trí tuệ với chi phí của chúng tôi
➤ Cải tiến rõ ràng: Cùng với những cải tiến này cho các tác nhân và gọi công cụ, Grok 4.1 Fast giữ lại những điểm mạnh của người tiền nhiệm: giá cả thấp ($0.2/0.5 cho mỗi triệu token đầu vào/đầu ra), cửa sổ ngữ cảnh lớn (2 triệu token), và hiệu quả token
Chúc mừng đội ngũ @xai và @elonmusk về bản phát hành mới này!
Xem bên dưới để biết thêm phân tích

Grok 4.1 Fast đạt 64 trên Chỉ số Trí tuệ Phân tích Nhân tạo, cao hơn 4 điểm so với Grok 4, điều này cho thấy đây là một bản nâng cấp rõ rệt so với phiên bản trước.

Grok 4.1 Fast đã sử dụng 71 triệu token để hoàn thành các đánh giá Chỉ số Trí tuệ Phân tích Nhân tạo với chi phí 45 đô la, tương tự như Grok 4 và thấp hơn đáng kể cả về số lượng lẫn chi phí so với hầu hết các mô hình hàng đầu khác.

Kết quả benchmark cá nhân: MMLU-Pro, GPQA Diamond, Kỳ thi cuối cùng của nhân loại, LiveCodeBench, SciCode, AIME 2025, IFBench, AA-LCR, Terminal-Bench Hard, 𝜏²-Bench Telecom

Xem trang mô hình của chúng tôi để phân tích thêm về hiệu suất, chi phí và khả năng của Grok 4.1 Fast
55,59K
Hàng đầu
Thứ hạng
Yêu thích

