Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Gemini 3 Pro acaba de ocupar el puesto #1 en nuestro nuevo Índice AA-Omniscienzo, pero es una historia matizada
AA-Omnisciencia es nuestra nueva evaluación de conocimientos y alucinaciones. El liderazgo de Gemini 3 Pro se basa en su alta Precisión (porcentaje correcto); el modelo obtuvo una puntuación impresionante de 14 puntos más alta que el siguiente modelo con mayor precisión, Grok 4. La tasa de alucinaciones de Gemini 3 Pro en la evaluación es del 88%, igual que la de Gemini 2.5 Pro y Gemini 2.5 Flash. Esto sugiere que Gemini 3 Pro logró avances sustanciales en conocimiento, pero no como avances materiales en su tendencia a alucinar.
Medimos la Tasa de Alucinaciones en función de la frecuencia con la que el modelo responde incorrectamente cuando debería haberse negado, definido como la proporción de respuestas incorrectas entre todos los intentos no correctos. En AA-Omnisciencia, encontramos que había poca correlación entre la precisión y la tasa de alucinaciones.
Además, encontramos una alta correlación entre el tamaño de los modelos de pesos abiertos y la precisión (pero no la tasa de alucinaciones). Por tanto, la alta precisión de Gemini 3 Pro sugiere que es un modelo muy grande.
Consulta más abajo para más detalles sobre AA-Omnisciencia 👇

Populares
Ranking
Favoritas

