DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Gemini 3 Pro otti juuri #1 sijan uudessa AA-Omniscience Indexissämme — mutta tarina on vivahteikas AA-Kaikkitietävyys on uusi tietomme ja hallusinaatioarviointimme. Gemini 3 Pron johtajuutta ohjaa sen korkea tarkkuus (prosentti oikea); malli sai peräti 14 pistettä enemmän kuin seuraavaksi tarkin malli, Grok 4. Gemini 3 Pron hallusinaatioprosentti arvioinnissa on 88 %, sama kuin Gemini 2.5 Prossa ja Gemini 2.5 Flashissa. Tämä viittaa siihen, että Gemini 3 Pro saavutti merkittäviä edistysaskeleita tiedoissa, mutta ei aineellisesti hallusinaatioiden taipumuksessaan. Mittaamme hallusinaatioprosenttia sen perusteella, kuinka usein malli vastaa väärin silloin kun sen olisi pitänyt kieltäytyä, ja se määritellään väärien vastausten osuudeksi kaikista ei-oikeista yrityksistä. AA-Omnisciencessa havaitsimme, että tarkkuuden ja hallusinaationopeuden välillä oli vähän korrelaatiota. Lisäksi havaitsimme, että avoimen painon mallien koon ja tarkkuuden välillä on korkea korrelaatio (mutta ei hallusinaationopeuden). Näin ollen Gemini 3 Pron erittäin korkea tarkkuus viittaa siihen, että kyseessä on erittäin suuri malli. Katso alta lisätietoja AA-Kaikkitietävyydestä 👇

Johtavat

Rankkaus

Suosikit