Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 O Baidu ERNIE 5.0 está aqui - quão bom é realmente?
Uma crítica amplamente lida do colaborador do Zhihu, toyama nao, oferece análises claras.
O Baidu ficou atrás do OpenAI em 3-6 meses com lançamentos correspondentes à versão. Depois do GPT-5, o ERNIE 5.0 chegou na hora certa - e, ao contrário do 4.5 apressado, finalmente parece um modelo doméstico sólido de primeira linha.
O desempenho salta ~ 80% em relação ao X1.1, igualando aproximadamente o MiniMax M2. Os dados de treinamento parecem reconstruídos: os resultados são muito mais limpos e coerentes (Fig. 1).
👇 Aqui está a comparação destilada:
✅Onde o ERNIE 5.0 fica melhor
• Seguimento de instruções: Pontuações altas e até picos de primeira linha - mas com falhas estranhas de baixo custo (por exemplo, formatos de data inconsistentes entre as passagens).
• Computação básica: Confiável para matemática de nível K12; mais estável que X1.1, embora ainda mais fraco que M2 em tarefas complexas.
• Saída muito mais limpa: X1.1 sofria de dados destilados ruidosos e traduções desajeitadas. O ERNIE 5.0 corrige isso em grande parte: cadeias de pensamento mais claras, respostas finais mais limpas, melhor legibilidade.
🙋 Onde ainda luta
• Alta taxa de alucinação: Muitas respostas confiantes, mas erradas, sobre recuperação de símbolos matemáticos, embaralhamento de caracteres e tarefas de contexto longo - mais próximas do desempenho de raciocínio de segundo nível.
• Baixa perspicácia: Não consegue detectar padrões subjacentes (padrão de letra # 46, raciocínio calendárico # 32), muitas vezes força bruta em vez de abstração.
• Loops infinitos ocasionais: Raros (<3%), mas surpreendentes, já que desapareceram nos modelos domésticos recentes.
• Habilidade fraca de vários turnos: Muitas vezes esquece regras ou turnos anteriores antes da rodada 7; loops acionados com mais facilidade.
💬O Veredicto
A era de trilhões de parâmetros da China tem apenas 3 meses, e o Baidu já saltou para um modelo 2T.
No entanto, comparado com o Kimi K2 Thinking, o ERNIE 5.0 parece um pouco "inchado" - grande, capaz, mas não usando totalmente seu peso.
Ainda assim, este pode ser o tão esperado sinal de retorno de @Baidu_Inc - um lembrete de que o Baidu pretende permanecer na corrida do LLM.
📖 Avaliação completa:
🔗 Ponto de referência:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Melhores
Classificação
Favoritos

