🤔 Baidu ERNIE 5.0 är här - hur bra är det egentligen? En mycket läst recension från Zhihu-bidragsgivaren toyama nao ger tydliga uppdelningar. Baidu har släpat efter OpenAI med 3-6 månader med versionsmatchade utgåvor. Efter GPT-5 kom ERNIE 5.0 på beställning - och till skillnad från den forcerade 4.5 ser den äntligen ut som en solid inhemsk modell i första klassen. Prestandan hoppar ~80 % över X1.1, vilket ungefär matchar MiniMax M2. Träningsdata verkar byggas om: resultaten är mycket renare och mer sammanhängande (Fig 1). 👇 Här är den destillerade jämförelsen: ✅Där ERNIE 5.0 blir bättre • Instruktioner följande: Höga poäng och till och med toppar på toppnivå – men med konstiga fel i den lägre klassen (t.ex. inkonsekventa datumformat över pass). • Grundläggande beräkning: Tillförlitlig för matematik på K12-nivå; mer stabil än X1.1, men fortfarande svagare än M2 på komplexa uppgifter. • Mycket renare utdata: X1.1 led av bullriga destillerade data och besvärliga översättningar. ERNIE 5.0 fixar till stor del detta: klarare tankekedjor, renare slutliga svar, bättre läsbarhet. 🙋 Där den fortfarande kämpar • Hög hallucinationsfrekvens: För många självsäkra men felaktiga svar på återställning av matematiska symboler, teckenförvrängning och uppgifter med långa sammanhang – närmare andra klassens resonemangsprestanda. • Låg insiktsfullhet: Misslyckas med att upptäcka underliggande mönster (#46 bokstavsmönster, #32 kalendariskt resonemang), ofta brute-forcering istället för abstraherande. • Enstaka oändliga loopar: Sällsynta (<3 %) men förvånande, med tanke på att de hade försvunnit i de senaste inhemska modellerna. • Svag multi-turn-förmåga: Glömmer ofta regler eller tidigare varv före omgång 7; loopar utlöses lättare. 💬Slutsats Kinas era med biljoner parametrar är knappt 3 månader gammal, och Baidu har redan hoppat till en 2T-modell. Men jämfört med Kimi K2 Thinking känns ERNIE 5.0 lite "puffig" – stor, kapabel, men utnyttjar inte sin vikt fullt ut. Ändå kan detta vara @Baidu_Inc efterlängtade comebacksignal - en påminnelse om att Baidu har för avsikt att stanna kvar i LLM-loppet. 📖 Fullständig utvärdering: 🔗 Riktmärke: #ERNIE5 #Baidu #AI #LLM #ChinaAI