Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 este aici - cât de bun este cu adevărat?
O recenzie citită pe scară largă de la colaboratorul Zhihu, toyama nao, oferă defalcări clare.
Baidu a rămas în urma OpenAI cu 3-6 luni cu versiuni potrivite. După GPT-5, ERNIE 5.0 a sosit la indicație - și, spre deosebire de 4.5 grăbit, arată în sfârșit ca un model intern solid de prim nivel.
Performanța crește cu ~80% față de X1.1, egalând aproximativ MiniMax M2. Datele de antrenament par reconstruite: ieșirile sunt mult mai curate și mai coerente (Fig 1).
👇 Iată comparația distilată:
✅Unde ERNIE 5.0 devine mai bun
• Urmărirea instrucțiunilor: scoruri mari și chiar vârfuri de top - dar cu eșecuri ciudate de nivel scăzut (de exemplu, formate de date inconsecvente între treceri).
• Calcul de bază: Fiabil pentru matematica de nivel K12; mai stabil decât X1.1, deși încă mai slab decât M2 la sarcini complexe.
• Ieșire mult mai curată: X1.1 a suferit de date distilate zgomotoase și traduceri incomode. ERNIE 5.0 rezolvă în mare măsură acest lucru: lanțuri de gândire mai clare, răspunsuri finale mai curate, lizibilitate mai bună.
🙋 Unde încă se luptă
• Rata mare de halucinații: Prea multe răspunsuri încrezătoare, dar greșite, la recuperarea simbolurilor matematice, amestecarea caracterelor și sarcinile cu context lung - mai aproape de performanța raționamentului de nivel doi.
• Perspicacitate scăzută: Nu reușește să identifice modelele subiacente (model de litere # 46, raționament calendaric # 32), adesea forțând brută în loc de abstractizare.
• Bucle infinite ocazionale: Rare (<3%), dar surprinzătoare, având în vedere că au dispărut la modelele autohtone recente.
• Abilitate slabă de mai multe ture: Uită adesea regulile sau turele anterioare înainte de runda 7; bucle declanșate mai ușor.
💬Verdictul
Era a trilioanelor de parametri din China are doar 3 luni, iar Baidu a sărit deja la un model 2T.
Cu toate acestea, în comparație cu Kimi K2 Thinking, ERNIE 5.0 se simte puțin "umflat" - mare, capabil, dar nu își folosește pe deplin greutatea.
Cu toate acestea, acesta ar putea fi semnalul de revenire mult așteptat al lui @Baidu_Inc – un memento că Baidu intenționează să rămână în cursa LLM.
📖 Evaluare completă:
🔗 Reper:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Limită superioară
Clasament
Favorite

