Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 ya está aquí — ¿qué tan bueno es realmente?
Una reseña muy leída del colaborador de Zhihu toyama nao ofrece desgloses claros.
Baidu ha estado detrás de OpenAI por 3-6 meses con lanzamientos de versiones coincidentes. Después de GPT-5, ERNIE 5.0 llegó a tiempo — y a diferencia del apresurado 4.5, finalmente parece un modelo nacional sólido de primer nivel.
El rendimiento aumenta ~80% sobre X1.1, igualando aproximadamente a MiniMax M2. Los datos de entrenamiento parecen haber sido reconstruidos: las salidas son mucho más limpias y coherentes (Fig 1).
👇 Aquí está la comparación destilada:
✅Dónde ERNIE 5.0 Mejora
• Seguimiento de instrucciones: Altas puntuaciones e incluso picos de primer nivel — pero con extrañas fallas en el extremo bajo (por ejemplo, formatos de fecha inconsistentes en los pases).
• Cálculo básico: Fiable para matemáticas de nivel K12; más estable que X1.1, aunque aún más débil que M2 en tareas complejas.
• Salida mucho más limpia: X1.1 sufría de datos destilados ruidosos y traducciones torpes. ERNIE 5.0 soluciona en gran medida esto: cadenas de pensamiento más claras, respuestas finales más limpias, mejor legibilidad.
🙋 Dónde Aún Lucha
• Alta tasa de alucinaciones: Demasiadas respuestas seguras pero incorrectas sobre recuperación de símbolos matemáticos, desorden de caracteres y tareas de contexto largo — más cerca de un rendimiento de razonamiento de segundo nivel.
• Baja perspicacia: No logra detectar patrones subyacentes (#46 patrón de letras, #32 razonamiento calendárico), a menudo fuerza en lugar de abstraer.
• Bucles infinitos ocasionales: Raros (<3%) pero sorprendentes, dado que habían desaparecido en modelos nacionales recientes.
• Débil capacidad de múltiples turnos: A menudo olvida reglas o turnos anteriores antes de la ronda 7; los bucles se activan más fácilmente.
💬El Veredicto
La era de los billones de parámetros de China apenas tiene 3 meses, y Baidu ya saltó a un modelo de 2T.
Sin embargo, comparado con Kimi K2 Thinking, ERNIE 5.0 se siente un poco "inflado" — grande, capaz, pero no utilizando completamente su peso.
Aún así, esto puede ser la señal de regreso tan esperada de @Baidu_Inc — un recordatorio de que Baidu tiene la intención de permanecer en la carrera de LLM.
📖 Evaluación completa:
🔗 Referencia:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Parte superior
Clasificación
Favoritos

