Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 är här - hur bra är det egentligen?
En mycket läst recension från Zhihu-bidragsgivaren toyama nao ger tydliga uppdelningar.
Baidu har släpat efter OpenAI med 3-6 månader med versionsmatchade utgåvor. Efter GPT-5 kom ERNIE 5.0 på beställning - och till skillnad från den forcerade 4.5 ser den äntligen ut som en solid inhemsk modell i första klassen.
Prestandan hoppar ~80 % över X1.1, vilket ungefär matchar MiniMax M2. Träningsdata verkar byggas om: resultaten är mycket renare och mer sammanhängande (Fig 1).
👇 Här är den destillerade jämförelsen:
✅Där ERNIE 5.0 blir bättre
• Instruktioner följande: Höga poäng och till och med toppar på toppnivå – men med konstiga fel i den lägre klassen (t.ex. inkonsekventa datumformat över pass).
• Grundläggande beräkning: Tillförlitlig för matematik på K12-nivå; mer stabil än X1.1, men fortfarande svagare än M2 på komplexa uppgifter.
• Mycket renare utdata: X1.1 led av bullriga destillerade data och besvärliga översättningar. ERNIE 5.0 fixar till stor del detta: klarare tankekedjor, renare slutliga svar, bättre läsbarhet.
🙋 Där den fortfarande kämpar
• Hög hallucinationsfrekvens: För många självsäkra men felaktiga svar på återställning av matematiska symboler, teckenförvrängning och uppgifter med långa sammanhang – närmare andra klassens resonemangsprestanda.
• Låg insiktsfullhet: Misslyckas med att upptäcka underliggande mönster (#46 bokstavsmönster, #32 kalendariskt resonemang), ofta brute-forcering istället för abstraherande.
• Enstaka oändliga loopar: Sällsynta (<3 %) men förvånande, med tanke på att de hade försvunnit i de senaste inhemska modellerna.
• Svag multi-turn-förmåga: Glömmer ofta regler eller tidigare varv före omgång 7; loopar utlöses lättare.
💬Slutsats
Kinas era med biljoner parametrar är knappt 3 månader gammal, och Baidu har redan hoppat till en 2T-modell.
Men jämfört med Kimi K2 Thinking känns ERNIE 5.0 lite "puffig" – stor, kapabel, men utnyttjar inte sin vikt fullt ut.
Ändå kan detta vara @Baidu_Inc efterlängtade comebacksignal - en påminnelse om att Baidu har för avsikt att stanna kvar i LLM-loppet.
📖 Fullständig utvärdering:
🔗 Riktmärke:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Topp
Rankning
Favoriter

