Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 O Baidu ERNIE 5.0 chegou — quão bom é realmente?
Uma análise amplamente lida do colaborador do Zhihu toyama nao oferece uma análise clara.
O Baidu ficou atrás da OpenAI por 3-6 meses com lançamentos de versões correspondentes. Após o GPT-5, o ERNIE 5.0 chegou na hora certa — e ao contrário do apressado 4.5, finalmente parece um modelo doméstico sólido de primeira linha.
O desempenho aumentou cerca de 80% em relação ao X1.1, correspondendo aproximadamente ao MiniMax M2. Os dados de treinamento parecem ter sido reconstruídos: as saídas estão muito mais limpas e coerentes (Fig 1).
👇 Aqui está a comparação destilada:
✅ Onde o ERNIE 5.0 Melhorou
• Seguir instruções: Altas pontuações e até picos de primeira linha — mas com estranhas falhas de baixo desempenho (por exemplo, formatos de data inconsistentes entre as passagens).
• Cálculo básico: Confiável para matemática de nível K12; mais estável que o X1.1, embora ainda mais fraco que o M2 em tarefas complexas.
• Saída muito mais limpa: O X1.1 sofria de dados destilados ruidosos e traduções estranhas. O ERNIE 5.0 corrige em grande parte isso: cadeias de pensamento mais claras, respostas finais mais limpas, melhor legibilidade.
🙋 Onde Ainda Enfrenta Dificuldades
• Alta taxa de alucinação: Muitas respostas confiantes, mas erradas, na recuperação de símbolos matemáticos, embaralhamento de caracteres e tarefas de longo contexto — mais próximo de um desempenho de raciocínio de segunda linha.
• Baixa perspicácia: Falha em identificar padrões subjacentes (#46 padrão de letras, #32 raciocínio calendárico), muitas vezes forçando em vez de abstrair.
• Laços infinitos ocasionais: Raros (<3%), mas surpreendentes, dado que haviam desaparecido em modelos domésticos recentes.
• Habilidade fraca em múltiplas interações: Muitas vezes esquece regras ou turnos anteriores antes do turno 7; laços são acionados mais facilmente.
💬 O Veredicto
A era dos trilhões de parâmetros da China tem apenas 3 meses, e o Baidu já saltou para um modelo de 2T.
Ainda assim, comparado ao Kimi K2 Thinking, o ERNIE 5.0 parece um pouco "inchado" — grande, capaz, mas não utilizando totalmente seu peso.
Ainda assim, isso pode ser um sinal de retorno tão aguardado da @Baidu_Inc — um lembrete de que o Baidu pretende permanecer na corrida dos LLM.
📖 Avaliação completa:
🔗 Benchmark:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Top
Classificação
Favoritos

