DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

🤔 Baidu ERNIE 5.0 è qui — quanto è davvero buono? Una recensione molto letta del contributore di Zhihu toyama nao offre analisi chiare. Baidu ha inseguito OpenAI per 3-6 mesi con rilasci di versioni corrispondenti. Dopo GPT-5, ERNIE 5.0 è arrivato puntualmente — e a differenza del precipitato 4.5, sembra finalmente un solido modello domestico di prima fascia. Le prestazioni aumentano di circa l'80% rispetto a X1.1, corrispondendo grosso modo a MiniMax M2. I dati di addestramento sembrano ricostruiti: le uscite sono molto più pulite e coerenti (Fig 1). 👇 Ecco il confronto distillato: ✅Dove ERNIE 5.0 Migliora • Seguire le istruzioni: Punteggi elevati e persino picchi di prima fascia — ma con strane mancanze a bassa prestazione (ad es., formati di data incoerenti tra i passaggi). • Calcolo di base: Affidabile per la matematica a livello K12; più stabile di X1.1, anche se ancora più debole di M2 in compiti complessi. • Uscita molto più pulita: X1.1 soffriva di dati distillati rumorosi e traduzioni imbarazzanti. ERNIE 5.0 risolve in gran parte questo problema: catene di pensiero più chiare, risposte finali più pulite, migliore leggibilità. 🙋 Dove Ha Ancora Difficoltà • Alta percentuale di allucinazioni: Troppi risposte sicure ma errate sul recupero di simboli matematici, mescolamento di caratteri e compiti a lungo termine — più vicine a prestazioni di ragionamento di seconda fascia. • Bassa capacità di intuizione: Non riesce a individuare schemi sottostanti (#46 schema di lettere, #32 ragionamento calendrico), spesso forzando invece di astrarre. • Loop infiniti occasionali: Rari (<3%) ma sorprendenti, dato che erano scomparsi nei modelli domestici recenti. • Debole capacità multi-turno: Spesso dimentica regole o turni precedenti prima del turno 7; i loop si attivano più facilmente. 💬Il Verdicto L'era dei trilioni di parametri della Cina è appena iniziata da 3 mesi, e Baidu è già passato a un modello da 2T. Eppure, rispetto a Kimi K2 Thinking, ERNIE 5.0 sembra un po' "gonfio" — grande, capace, ma non sfruttando appieno il suo peso. Tuttavia, questo potrebbe essere il tanto atteso segnale di ritorno di @Baidu_Inc — un promemoria che Baidu intende rimanere nella corsa agli LLM. 📖 Valutazione completa: 🔗 Benchmark: #ERNIE5 #Baidu #AI #LLM #ChinaAI

Principali

Ranking

Preferiti