Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Chez Box, nous passons beaucoup de temps à tester Box AI avec de nouveaux modèles sur des données non structurées pour voir dans quels domaines ils excellent dans le travail de connaissance réel.
Comme nous l'avons vu dans les benchmarks, GPT-5 offre un saut significatif en capacité par rapport à GPT-4.1 en raisonnement, mathématiques, logique, codage et d'autres domaines de travail. Voici quelques exemples de la manière dont ces améliorations se manifestent dans le monde réel :
*GPT 5 contextualise mieux l'information. Lors de l'extraction de données comme le montant final en USD sur une facture sans étiquettes de devise mais avec une adresse à Londres, GPT 5 répond correctement en ayant besoin d'un taux de conversion de l'USD au GBP. En comparaison, GPT 4.1 a vu la facture finale et l'a retournée, supposant la devise (incorrectement).
* GPT-5 fournit une meilleure analyse multimodale. Pour le dépôt annuel d'une entreprise publique, on demande à GPT-5 d'isoler une cellule dans un tableau à partir d'une image montrant les changements dans les composants des capitaux propres de l'entreprise. Le haut du tableau précise que tous les montants d'actions sont en milliers, et GPT-5 indique clairement cette conversion, tandis que GPT-4.1 ne le fait pas, se confondant étant donné que le tableau dit actions et la légende dit parts.
* GPT-5 fonctionne mieux avec des niveaux élevés de complexité des invites et des données. Lors de l'extraction de données sur un CV pour toutes les dates de début d'emploi, les noms de postes et les noms d'employeurs, GPT-5 a pu extraire chaque élément de données tandis que GPT-4.1 semble être submergé et n'a pas extrait les mêmes champs compte tenu de la taille de l'invite et de la complexité du document.
* GPT-5 est beaucoup plus clair et explicite dans ses réponses. Dans un contrat d'externalisation avec 6 services différents explicitement discutés, lorsqu'on lui demande "les 5 services spécifiques dans le contrat", GPT-5 retournera les 5 premiers et demandera s'il était intentionnel que le sixième ne soit pas mentionné. En comparaison, GPT-4.1 a simplement retourné les 5 premiers sans autres réserves, ce qui peut entraîner une confusion en aval pour l'utilisateur.
* GPT-5 est meilleur pour l'interprétation des données dans des domaines complexes. Pour un graphique de cytométrie en flux, généralement utilisé en immunologie, GPT-5 a correctement identifié une forte proportion de cellules mortes et a donné des causes plausibles qui pourraient mener à cette situation, tandis que GPT-4.1 a donné un raisonnement minimal, nécessitant une confirmation supplémentaire pour avoir des suppositions à partir des données brutes.
* GPT-5 est mieux à même d'identifier les incohérences dans le code. Lorsqu'on lui demande d'identifier des problèmes dans un fichier de code python donné, bien que GPT-5 et 4.1 puissent identifier de réelles erreurs qui entraînent des dysfonctionnements, seul GPT-5 a pu inférer des problèmes plus subtils, comme l'impression de la variable incorrecte lorsque cela n'aurait pas de sens dans le contexte du programme.
Ces améliorations en mathématiques, raisonnement, logique et qualité des réponses dans des fenêtres de contexte plus longues sont incroyablement utiles pour les utilisateurs finaux dans leur travail quotidien, mais elles se manifesteront encore plus avec des agents d'IA fonctionnant plus longtemps, surtout lorsqu'il n'y a pas d'humain dans la boucle pour vérifier l'information à chaque étape.
C'est formidable de voir ces améliorations continuer à arriver dans la dernière génération de modèles d'IA, car cela conduira à des agents d'IA capables d'être utilisés dans des domaines de travail de plus en plus critiques.
77,96K
Meilleurs
Classement
Favoris