🤔 Baidu ERNIE 5.0 ya está aquí — ¿qué tan bueno es realmente? Una reseña muy leída del colaborador de Zhihu toyama nao ofrece desgloses claros. Baidu ha estado detrás de OpenAI por 3-6 meses con lanzamientos de versiones coincidentes. Después de GPT-5, ERNIE 5.0 llegó a tiempo — y a diferencia del apresurado 4.5, finalmente parece un modelo nacional sólido de primer nivel. El rendimiento aumenta ~80% sobre X1.1, igualando aproximadamente a MiniMax M2. Los datos de entrenamiento parecen haber sido reconstruidos: las salidas son mucho más limpias y coherentes (Fig 1). 👇 Aquí está la comparación destilada: ✅Dónde ERNIE 5.0 Mejora • Seguimiento de instrucciones: Altas puntuaciones e incluso picos de primer nivel — pero con extrañas fallas en el extremo bajo (por ejemplo, formatos de fecha inconsistentes en los pases). • Cálculo básico: Fiable para matemáticas de nivel K12; más estable que X1.1, aunque aún más débil que M2 en tareas complejas. • Salida mucho más limpia: X1.1 sufría de datos destilados ruidosos y traducciones torpes. ERNIE 5.0 soluciona en gran medida esto: cadenas de pensamiento más claras, respuestas finales más limpias, mejor legibilidad. 🙋 Dónde Aún Lucha • Alta tasa de alucinaciones: Demasiadas respuestas seguras pero incorrectas sobre recuperación de símbolos matemáticos, desorden de caracteres y tareas de contexto largo — más cerca de un rendimiento de razonamiento de segundo nivel. • Baja perspicacia: No logra detectar patrones subyacentes (#46 patrón de letras, #32 razonamiento calendárico), a menudo fuerza en lugar de abstraer. • Bucles infinitos ocasionales: Raros (<3%) pero sorprendentes, dado que habían desaparecido en modelos nacionales recientes. • Débil capacidad de múltiples turnos: A menudo olvida reglas o turnos anteriores antes de la ronda 7; los bucles se activan más fácilmente. 💬El Veredicto La era de los billones de parámetros de China apenas tiene 3 meses, y Baidu ya saltó a un modelo de 2T. Sin embargo, comparado con Kimi K2 Thinking, ERNIE 5.0 se siente un poco "inflado" — grande, capaz, pero no utilizando completamente su peso. Aún así, esto puede ser la señal de regreso tan esperada de @Baidu_Inc — un recordatorio de que Baidu tiene la intención de permanecer en la carrera de LLM. 📖 Evaluación completa: 🔗 Referencia: #ERNIE5 #Baidu #AI #LLM #ChinaAI