Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 è qui — quanto è davvero buono?
Una recensione molto letta del contributore di Zhihu toyama nao offre analisi chiare.
Baidu ha inseguito OpenAI per 3-6 mesi con rilasci di versioni corrispondenti. Dopo GPT-5, ERNIE 5.0 è arrivato puntualmente — e a differenza del precipitato 4.5, sembra finalmente un solido modello domestico di prima fascia.
Le prestazioni aumentano di circa l'80% rispetto a X1.1, corrispondendo grosso modo a MiniMax M2. I dati di addestramento sembrano ricostruiti: le uscite sono molto più pulite e coerenti (Fig 1).
👇 Ecco il confronto distillato:
✅Dove ERNIE 5.0 Migliora
• Seguire le istruzioni: Punteggi elevati e persino picchi di prima fascia — ma con strane mancanze a bassa prestazione (ad es., formati di data incoerenti tra i passaggi).
• Calcolo di base: Affidabile per la matematica a livello K12; più stabile di X1.1, anche se ancora più debole di M2 in compiti complessi.
• Uscita molto più pulita: X1.1 soffriva di dati distillati rumorosi e traduzioni imbarazzanti. ERNIE 5.0 risolve in gran parte questo problema: catene di pensiero più chiare, risposte finali più pulite, migliore leggibilità.
🙋 Dove Ha Ancora Difficoltà
• Alta percentuale di allucinazioni: Troppi risposte sicure ma errate sul recupero di simboli matematici, mescolamento di caratteri e compiti a lungo termine — più vicine a prestazioni di ragionamento di seconda fascia.
• Bassa capacità di intuizione: Non riesce a individuare schemi sottostanti (#46 schema di lettere, #32 ragionamento calendrico), spesso forzando invece di astrarre.
• Loop infiniti occasionali: Rari (<3%) ma sorprendenti, dato che erano scomparsi nei modelli domestici recenti.
• Debole capacità multi-turno: Spesso dimentica regole o turni precedenti prima del turno 7; i loop si attivano più facilmente.
💬Il Verdicto
L'era dei trilioni di parametri della Cina è appena iniziata da 3 mesi, e Baidu è già passato a un modello da 2T.
Eppure, rispetto a Kimi K2 Thinking, ERNIE 5.0 sembra un po' "gonfio" — grande, capace, ma non sfruttando appieno il suo peso.
Tuttavia, questo potrebbe essere il tanto atteso segnale di ritorno di @Baidu_Inc — un promemoria che Baidu intende rimanere nella corsa agli LLM.
📖 Valutazione completa:
🔗 Benchmark:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Principali
Ranking
Preferiti

