DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Gemini 3 Pro har precis tagit #1-platsen i vårt nya AA-Omniscience Index — men det är en nyanserad berättelse AA-Allvetande är vår nya kunskaps- och hallucinationsutvärdering. Gemini 3 Pros ledarskap drivs av dess höga noggrannhet (procentuell korrekthet); modellen fick hela 14 poäng högre än nästa modell med högst noggrannhet, Grok 4. Gemini 3 Pros hallucinationsfrekvens i utvärderingen är 88 %, samma som Gemini 2.5 Pro och Gemini 2.5 Flash. Detta tyder på att Gemini 3 Pro gjorde betydande kunskapsvinster men inte materiella framsteg i sin tendens att hallucinera. Vi mäter hallucinationsfrekvensen baserat på hur ofta modellen svarar fel när den borde ha vägrat, definierat som andelen felaktiga svar av alla icke-korrekta försök. I AA-Omniscience fann vi att det fanns liten korrelation mellan noggrannhet och hallucinationsfrekvens. Dessutom fann vi att det finns en hög korrelation mellan storleken på öppna viktmodeller och noggrannhet (men inte hallucinationsfrekvens). Därför tyder Gemini 3 Pros mycket höga noggrannhet på att det är en mycket stor modell. Se nedan för ytterligare detaljer om AA-Omniscience 👇

Topp

Rankning

Favoriter