Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Gemini 3 Pro heeft net de #1 plek veroverd in onze nieuwe AA-Omniscience Index — maar het is een genuanceerd verhaal
AA-Omniscience is onze nieuwe evaluatie van kennis en hallucinaties. De leiderschap van Gemini 3 Pro wordt gedreven door zijn hoge Nauwkeurigheid (percentage correct); het model scoorde maar liefst 14 punten hoger dan het model met de op één na hoogste nauwkeurigheid, Grok 4. De Hallucinatiegraad van Gemini 3 Pro in de evaluatie is 88%, hetzelfde als Gemini 2.5 Pro en Gemini 2.5 Flash. Dit suggereert dat Gemini 3 Pro aanzienlijke vooruitgang heeft geboekt in kennis, maar niet in materiële zin in zijn neiging om te hallucineren.
We meten de Hallucinatiegraad op basis van hoe vaak het model onjuist antwoordt wanneer het had moeten weigeren, gedefinieerd als de verhouding van verkeerde antwoorden ten opzichte van alle niet-correcte pogingen. In AA-Omniscience hebben we ontdekt dat er weinig correlatie is tussen Nauwkeurigheid en Hallucinatiegraad.
Bovendien hebben we ontdekt dat er een hoge correlatie is tussen de grootte van open gewichtenmodellen en Nauwkeurigheid (maar niet Hallucinatiegraad). Als zodanig suggereert de zeer hoge Nauwkeurigheid van Gemini 3 Pro dat het een zeer groot model is.
Zie hieronder voor verdere details over AA-Omniscience 👇

Boven
Positie
Favorieten

