🤔 O Baidu ERNIE 5.0 chegou — quão bom é realmente? Uma análise amplamente lida do colaborador do Zhihu toyama nao oferece uma análise clara. O Baidu ficou atrás da OpenAI por 3-6 meses com lançamentos de versões correspondentes. Após o GPT-5, o ERNIE 5.0 chegou na hora certa — e ao contrário do apressado 4.5, finalmente parece um modelo doméstico sólido de primeira linha. O desempenho aumentou cerca de 80% em relação ao X1.1, correspondendo aproximadamente ao MiniMax M2. Os dados de treinamento parecem ter sido reconstruídos: as saídas estão muito mais limpas e coerentes (Fig 1). 👇 Aqui está a comparação destilada: ✅ Onde o ERNIE 5.0 Melhorou • Seguir instruções: Altas pontuações e até picos de primeira linha — mas com estranhas falhas de baixo desempenho (por exemplo, formatos de data inconsistentes entre as passagens). • Cálculo básico: Confiável para matemática de nível K12; mais estável que o X1.1, embora ainda mais fraco que o M2 em tarefas complexas. • Saída muito mais limpa: O X1.1 sofria de dados destilados ruidosos e traduções estranhas. O ERNIE 5.0 corrige em grande parte isso: cadeias de pensamento mais claras, respostas finais mais limpas, melhor legibilidade. 🙋 Onde Ainda Enfrenta Dificuldades • Alta taxa de alucinação: Muitas respostas confiantes, mas erradas, na recuperação de símbolos matemáticos, embaralhamento de caracteres e tarefas de longo contexto — mais próximo de um desempenho de raciocínio de segunda linha. • Baixa perspicácia: Falha em identificar padrões subjacentes (#46 padrão de letras, #32 raciocínio calendárico), muitas vezes forçando em vez de abstrair. • Laços infinitos ocasionais: Raros (<3%), mas surpreendentes, dado que haviam desaparecido em modelos domésticos recentes. • Habilidade fraca em múltiplas interações: Muitas vezes esquece regras ou turnos anteriores antes do turno 7; laços são acionados mais facilmente. 💬 O Veredicto A era dos trilhões de parâmetros da China tem apenas 3 meses, e o Baidu já saltou para um modelo de 2T. Ainda assim, comparado ao Kimi K2 Thinking, o ERNIE 5.0 parece um pouco "inchado" — grande, capaz, mas não utilizando totalmente seu peso. Ainda assim, isso pode ser um sinal de retorno tão aguardado da @Baidu_Inc — um lembrete de que o Baidu pretende permanecer na corrida dos LLM. 📖 Avaliação completa: 🔗 Benchmark: #ERNIE5 #Baidu #AI #LLM #ChinaAI