Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Gemini 3 Pro acaba de ocupar el puesto #1 en nuestro nuevo Índice AA-Omniscienzo, pero es una historia matizada AA-Omnisciencia es nuestra nueva evaluación de conocimientos y alucinaciones. El liderazgo de Gemini 3 Pro se basa en su alta Precisión (porcentaje correcto); el modelo obtuvo una puntuación impresionante de 14 puntos más alta que el siguiente modelo con mayor precisión, Grok 4. La tasa de alucinaciones de Gemini 3 Pro en la evaluación es del 88%, igual que la de Gemini 2.5 Pro y Gemini 2.5 Flash. Esto sugiere que Gemini 3 Pro logró avances sustanciales en conocimiento, pero no como avances materiales en su tendencia a alucinar. Medimos la Tasa de Alucinaciones en función de la frecuencia con la que el modelo responde incorrectamente cuando debería haberse negado, definido como la proporción de respuestas incorrectas entre todos los intentos no correctos. En AA-Omnisciencia, encontramos que había poca correlación entre la precisión y la tasa de alucinaciones. Además, encontramos una alta correlación entre el tamaño de los modelos de pesos abiertos y la precisión (pero no la tasa de alucinaciones). Por tanto, la alta precisión de Gemini 3 Pro sugiere que es un modelo muy grande. Consulta más abajo para más detalles sobre AA-Omnisciencia 👇

Populares

Ranking

Favoritas