Gemini 3 Pro vient de prendre la première place dans notre nouvel Index AA-Omniscience — mais c'est une histoire nuancée AA-Omniscience est notre nouvelle évaluation de la connaissance et des hallucinations. Le leadership de Gemini 3 Pro est motivé par sa haute Précision (pourcentage de réponses correctes) ; le modèle a obtenu 14 points de plus que le modèle avec la deuxième meilleure précision, Grok 4. Le Taux d'Hallucination de Gemini 3 Pro dans l'évaluation est de 88 %, le même que Gemini 2.5 Pro et Gemini 2.5 Flash. Cela suggère que Gemini 3 Pro a réalisé des gains substantiels en connaissance mais pas autant de gains matériels dans sa tendance à halluciner. Nous mesurons le Taux d'Hallucination en fonction de la fréquence à laquelle le modèle répond incorrectement alors qu'il aurait dû refuser, défini comme la proportion de mauvaises réponses sur l'ensemble des tentatives non correctes. Dans AA-Omniscience, nous avons constaté qu'il y avait peu de corrélation entre la Précision et le Taux d'Hallucination. De plus, nous avons trouvé qu'il existe une forte corrélation entre la taille des modèles à poids ouverts et la Précision (mais pas le Taux d'Hallucination). Ainsi, la très haute Précision de Gemini 3 Pro suggère qu'il s'agit d'un modèle très grand. Voir ci-dessous pour plus de détails concernant AA-Omniscience 👇