🤔 O Baidu ERNIE 5.0 está aqui - quão bom é realmente? Uma crítica amplamente lida do colaborador do Zhihu, toyama nao, oferece análises claras. O Baidu ficou atrás do OpenAI em 3-6 meses com lançamentos correspondentes à versão. Depois do GPT-5, o ERNIE 5.0 chegou na hora certa - e, ao contrário do 4.5 apressado, finalmente parece um modelo doméstico sólido de primeira linha. O desempenho salta ~ 80% em relação ao X1.1, igualando aproximadamente o MiniMax M2. Os dados de treinamento parecem reconstruídos: os resultados são muito mais limpos e coerentes (Fig. 1). 👇 Aqui está a comparação destilada: ✅Onde o ERNIE 5.0 fica melhor • Seguimento de instruções: Pontuações altas e até picos de primeira linha - mas com falhas estranhas de baixo custo (por exemplo, formatos de data inconsistentes entre as passagens). • Computação básica: Confiável para matemática de nível K12; mais estável que X1.1, embora ainda mais fraco que M2 em tarefas complexas. • Saída muito mais limpa: X1.1 sofria de dados destilados ruidosos e traduções desajeitadas. O ERNIE 5.0 corrige isso em grande parte: cadeias de pensamento mais claras, respostas finais mais limpas, melhor legibilidade. 🙋 Onde ainda luta • Alta taxa de alucinação: Muitas respostas confiantes, mas erradas, sobre recuperação de símbolos matemáticos, embaralhamento de caracteres e tarefas de contexto longo - mais próximas do desempenho de raciocínio de segundo nível. • Baixa perspicácia: Não consegue detectar padrões subjacentes (padrão de letra # 46, raciocínio calendárico # 32), muitas vezes força bruta em vez de abstração. • Loops infinitos ocasionais: Raros (<3%), mas surpreendentes, já que desapareceram nos modelos domésticos recentes. • Habilidade fraca de vários turnos: Muitas vezes esquece regras ou turnos anteriores antes da rodada 7; loops acionados com mais facilidade. 💬O Veredicto A era de trilhões de parâmetros da China tem apenas 3 meses, e o Baidu já saltou para um modelo 2T. No entanto, comparado com o Kimi K2 Thinking, o ERNIE 5.0 parece um pouco "inchado" - grande, capaz, mas não usando totalmente seu peso. Ainda assim, este pode ser o tão esperado sinal de retorno de @Baidu_Inc - um lembrete de que o Baidu pretende permanecer na corrida do LLM. 📖 Avaliação completa: 🔗 Ponto de referência: #ERNIE5 #Baidu #AI #LLM #ChinaAI