Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Gemini 3 Pro otti juuri #1 sijan uudessa AA-Omniscience Indexissämme — mutta tarina on vivahteikas
AA-Kaikkitietävyys on uusi tietomme ja hallusinaatioarviointimme. Gemini 3 Pron johtajuutta ohjaa sen korkea tarkkuus (prosentti oikea); malli sai peräti 14 pistettä enemmän kuin seuraavaksi tarkin malli, Grok 4. Gemini 3 Pron hallusinaatioprosentti arvioinnissa on 88 %, sama kuin Gemini 2.5 Prossa ja Gemini 2.5 Flashissa. Tämä viittaa siihen, että Gemini 3 Pro saavutti merkittäviä edistysaskeleita tiedoissa, mutta ei aineellisesti hallusinaatioiden taipumuksessaan.
Mittaamme hallusinaatioprosenttia sen perusteella, kuinka usein malli vastaa väärin silloin kun sen olisi pitänyt kieltäytyä, ja se määritellään väärien vastausten osuudeksi kaikista ei-oikeista yrityksistä. AA-Omnisciencessa havaitsimme, että tarkkuuden ja hallusinaationopeuden välillä oli vähän korrelaatiota.
Lisäksi havaitsimme, että avoimen painon mallien koon ja tarkkuuden välillä on korkea korrelaatio (mutta ei hallusinaationopeuden). Näin ollen Gemini 3 Pron erittäin korkea tarkkuus viittaa siihen, että kyseessä on erittäin suuri malli.
Katso alta lisätietoja AA-Kaikkitietävyydestä 👇

Johtavat
Rankkaus
Suosikit

