Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 is hier — hoe goed is het echt?
Een veelgelezen recensie van Zhihu-bijdrager toyama nao biedt duidelijke analyses.
Baidu heeft OpenAI met 3-6 maanden achtervolgd met versie-gematchte releases. Na GPT-5 arriveerde ERNIE 5.0 op het juiste moment — en in tegenstelling tot de gehaaste 4.5, lijkt het eindelijk op een solide eersteklas binnenlands model.
De prestaties zijn met ~80% gestegen ten opzichte van X1.1, wat ongeveer overeenkomt met MiniMax M2. De trainingsdata lijkt opnieuw opgebouwd: de output is veel schoner en coherenter (Fig 1).
👇 Hier is de samengevoegde vergelijking:
✅ Waar ERNIE 5.0 beter wordt
• Instructie opvolging: Hoge scores en zelfs top-tier pieken — maar met vreemde lage fouten (bijv. inconsistente datumformaten over passes).
• Basisberekeningen: Betrouwbaar voor K12-niveau wiskunde; stabieler dan X1.1, hoewel nog steeds zwakker dan M2 bij complexe taken.
• Veel schonere output: X1.1 had last van ruisende gedistilleerde data en ongemakkelijke vertalingen. ERNIE 5.0 lost dit grotendeels op: duidelijkere denkprocessen, schonere eindantwoorden, betere leesbaarheid.
🙋 Waar het nog steeds moeite mee heeft
• Hoge hallucinatiegraad: Te veel zelfverzekerde maar foute antwoorden op wiskundige symboolherstel, karaktervervorming en taken met lange context — dichter bij tweede-tier redeneervaardigheden.
• Lage inzichtelijkheid: Faalt in het herkennen van onderliggende patronen (#46 letterpatroon, #32 kalenderredenering), vaak brute-forcing in plaats van abstraheren.
• Af en toe oneindige lussen: Zeldzaam (<3%) maar verrassend, gezien ze recent in binnenlandse modellen waren verdwenen.
• Zwakke multi-turn capaciteit: Vergeet vaak regels of eerdere beurten voor ronde 7; lussen worden gemakkelijker getriggerd.
💬 Het oordeel
China's triljoen-parameter tijdperk is nog maar 3 maanden oud, en Baidu is al overgestapt naar een 2T-model.
Toch voelt ERNIE 5.0 in vergelijking met Kimi K2 Thinking een beetje "opgeblazen" — groot, capabel, maar niet volledig gebruikmakend van zijn gewicht.
Toch kan dit het langverwachte comeback-signaal van @Baidu_Inc zijn — een herinnering dat Baidu van plan is om in de LLM-race te blijven.
📖 Volledige evaluatie:
🔗 Benchmark:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Boven
Positie
Favorieten

