🚨 AutoBench 1.0 – Run 4 está EN VIVO 📷 - 33 modelos de frontera clasificados (incluyendo GPT-5.1, Gemini 3 Pro, Grok 4.1, Kimi K2 Thinking, etc.) - 21 Modelos de clasificación - 300+ preguntas nuevas generadas - 220.000+ clasificaciones individuales Esta es la evaluación más resistente a la manipulación que hemos hecho nunca. Y sí... el ganador NO es quien la mayoría esperaba. 1/13