Les LLM ne s'améliorent pas... sûr, ouais, d'accord mon pote. Il suffit d'aller sur , de sélectionner un ensemble de modèles à travers des sauts de version majeurs (par exemple, GPT-3.5, GPT-4 et GPT-5), et de leur donner tous le même prompt. Il est impossible de ne pas le voir.
Avec des sorties de modèles aussi fréquentes qu'elles l'ont été dernièrement, nous tranchons le "wow" en petits incréments mensuels, de sorte que chacun semble décevant. Cependant, si l'on prend du recul, le changement d'échelle est évident.
73,69K