xAI zaktualizowało swój szybki, tani model skoncentrowany na agentach do Grok 4.1 Fast, skacząc o +4 punkty w Indeksie Sztucznej Analizy Inteligencji Kluczowe wnioski: ➤ Wiodąca wydajność agentów: Grok 4.1 Fast z rozumowaniem zajmuje pierwsze miejsce w naszym 𝜏²-Bench Telecom Leaderboard z wynikiem 93,3%, tuż przed Kimi K2 Thinking, co oznacza wzrost o +27 punktów w porównaniu do Grok 4 Fast ➤ Granica Pareto inteligencji: Podobnie jak jego poprzednik, Grok 4.1 Fast oferuje wiodącą inteligencję przy niskim koszcie - znajduje się tylko 1 punkt za Grok 4 w Indeksie Inteligencji przy ~30x niższym koszcie za token. To umieszcza Grok 4.1 Fast zdecydowanie w najbardziej atrakcyjnym kwadrancie naszego porównania Indeksu Inteligencji względem kosztów ➤ Wyraźna inkrementalna aktualizacja: Oprócz tych ulepszeń dla agentów i wywoływania narzędzi, Grok 4.1 Fast zachowuje mocne strony swojego poprzednika: niskie ceny (0,2/0,5 USD za milion tokenów wejściowych/wyjściowych), duże okno kontekstowe (2 miliony tokenów) i efektywność tokenów Gratulacje dla zespołu @xai i @elonmusk z okazji tej nowej wersji! Zobacz poniżej dalszą analizę
Grok 4.1 Fast osiąga wynik 64 w Indeksie Sztucznej Inteligencji Analizy, o 4 punkty wyższy niż Grok 4, co czyni go wyraźnym ulepszeniem w porównaniu do swojego poprzednika
Grok 4.1 Fast wykorzystał 71M tokenów do zakończenia ocen Indeksu Sztucznej Analizy Inteligencji, kosztując 45 USD, co jest podobne do Grok 4 i znacznie mniej w obu przypadkach niż w przypadku większości innych wiodących modeli.
Indywidualne wyniki benchmarków: MMLU-Pro, GPQA Diamond, Ostatni egzamin ludzkości, LiveCodeBench, SciCode, AIME 2025, IFBench, AA-LCR, Terminal-Bench Hard, 𝜏²-Bench Telecom
Zobacz naszą stronę modeli, aby uzyskać dalszą analizę wydajności, kosztów i możliwości Grok 4.1 Fast
55,59K