Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 er her - hvor bra er det egentlig?
En mye lest anmeldelse fra Zhihu-bidragsyter toyama nao gir klare sammenbrudd.
Baidu har ligget etter OpenAI med 3-6 måneder med versjonsmatchede utgivelser. Etter GPT-5 kom ERNIE 5.0 på kø – og i motsetning til den forhastede 4.5, ser den endelig ut som en solid innenlandsk modell på første nivå.
Ytelsen hopper ~80 % over X1.1, og matcher omtrent MiniMax M2. Treningsdata ser ut til å være gjenoppbygd: utgangene er mye renere og mer sammenhengende (fig 1).
👇 Her er den destillerte sammenligningen:
✅Hvor ERNIE 5.0 blir bedre
• Instruksjonsfølger: Høye poengsummer og til og med topper på toppnivå – men med merkelige low-end-feil (f.eks. inkonsekvente datoformater på tvers av passeringer).
• Grunnleggende beregning: Pålitelig for matematikk på K12-nivå; mer stabil enn X1.1, men fortsatt svakere enn M2 på komplekse oppgaver.
• Mye renere utgang: X1.1 led av støyende destillerte data og vanskelige oversettelser. ERNIE 5.0 fikser i stor grad dette: klarere tankekjeder, renere endelige svar, bedre lesbarhet.
🙋 Der det fortsatt sliter
• Høy hallusinasjonsrate: For mange sikre, men gale svar på gjenoppretting av matematiske symboler, tegnforvrengning og oppgaver med lang kontekst – nærmere andrelags resonneringsytelse.
• Lav innsikt: Klarer ikke å oppdage underliggende mønstre (#46 bokstavmønster, #32 kalendrisk resonnement), ofte brute-forcing i stedet for abstraherende.
• Sporadiske uendelige løkker: Sjeldne (<3 %), men overraskende, gitt at de hadde forsvunnet i nyere innenlandske modeller.
• Svak evne til flere svinger: Glemmer ofte regler eller tidligere svinger før runde 7; sløyfer utløses lettere.
💬Dommen
Kinas billion-parameter-æra er knapt 3 måneder gammel, og Baidu hoppet allerede til en 2T-modell.
Men sammenlignet med Kimi K2 Thinking, føles ERNIE 5.0 litt "oppblåst" - stor, dyktig, men ikke fullt ut utnytter vekten.
Likevel kan dette være @Baidu_Inc etterlengtede comeback-signal - en påminnelse om at Baidu har til hensikt å bli i LLM-løpet.
📖 Full evaluering:
🔗 Benchmark:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Topp
Rangering
Favoritter

