🚨 AutoBench 1.0 – Четвертий запуск АКТИВНИЙ 📷 - 33 рейтингові моделі Frontier (включно з GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking тощо) - 21 Модель ранжування - 300+ нових питань, створених - 220 000+ індивідуальних рейтингів Це найстійкіша до маніпуляцій оцінка, яку ми коли-небудь проводили. І так... переможець — НЕ той, кого більшість очікувала. 1/13