🚨 AutoBench 1.0 – Čtvrtý běh je ŽIVÝ 📷 - 33 modelů Frontier (včetně GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking atd.) - 21 Modely hodnocení - 300+ nových otázek generovaných - 220 000+ individuálních žebříčků Toto je nejodolnější manipulace hodnocení, jaké jsme kdy provedli. A ano... vítězem NENÍ ten, koho většina lidí očekávala. 1/13