Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🤔 Baidu ERNIE 5.0 on täällä – kuinka hyvä se oikeasti on?
Zhihun avustajan toyama naon laajalti luettu arvostelu tarjoaa selkeitä erittelyjä.
Baidu on jäänyt OpenAI:sta 3-6 kuukautta versioon sopivilla julkaisuilla. GPT-5:n jälkeen ERNIE 5.0 saapui vihjeestä – ja toisin kuin kiireinen 4.5, se näyttää vihdoin vankalta ensiluokkaiselta kotimaiselta mallilta.
Suorituskyky hyppää ~80 % X1.1:een verrattuna, mikä vastaa suunnilleen MiniMax M2:ta. Harjoitustiedot näyttävät rakennetun uudelleen: tulokset ovat paljon puhtaampia ja yhtenäisempiä (kuva 1).
👇 Tässä on tislattu vertailu:
✅Missä ERNIE 5.0 paranee
• Ohjeiden noudattaminen: Korkeat pisteet ja jopa huipputason huiput – mutta outoja alemman tason virheitä (esim. epäjohdonmukaiset päivämäärämuodot eri passeissa).
• Peruslaskenta: Luotettava K12-tason matematiikkaan; vakaampi kuin X1.1, mutta silti heikompi kuin M2 monimutkaisissa tehtävissä.
• Paljon puhtaampi tulostus: X1.1 kärsi kohinalaisesta tislatusta datasta ja hankalista käännöksistä. ERNIE 5.0 korjaa tämän suurelta osin: selkeämmät ajatusketjut, puhtaammat loppuvastaukset, parempi luettavuus.
🙋 Missä se edelleen kamppailee
• Korkea hallusinaatioprosentti: Liian monta itsevarmaa mutta väärää vastausta matemaattisten symbolien palauttamiseen, hahmojen sekoittamiseen ja pitkän kontekstin tehtäviin – lähempänä toisen tason päättelykykyä.
• Heikko oivallus: Ei havaitse taustalla olevia malleja (#46 kirjainkuvio, #32 kalenteripäättely), usein raaka pakottaminen abstraktoinnin sijaan.
• Satunnaiset äärettömät silmukat: Harvinainen (<3 %), mutta yllättävä, koska ne olivat kadonneet viimeaikaisista kotimaisista malleista.
• Heikko monikierroskyky: Unohtaa usein säännöt tai aiemmat vuorot ennen kierrosta 7; silmukat käynnistyvät helpommin.
💬Tuomio
Kiinan biljoonan parametrin aikakausi on tuskin 3 kuukautta vanha, ja Baidu hyppäsi jo 2T-malliin.
Silti verrattuna Kimi K2 Thinkingiin, ERNIE 5.0 tuntuu hieman "turvonneelta" – isolta, kyvykkäältä, mutta ei täysin hyödyntävältä.
Silti tämä saattaa olla @Baidu_Inc:n kauan odotettu paluusignaali – muistutus siitä, että Baidu aikoo pysyä LLM-kilpailussa.
📖 Koko arviointi:
🔗 Kiintopiste:
#ERNIE5 #Baidu #AI #LLM #ChinaAI

Johtavat
Rankkaus
Suosikit

