Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Bei Box verbringen wir viel Zeit damit, Box AI mit neuen Modellen an unstrukturierten Daten zu testen, um zu sehen, wo sie in realen Wissensarbeitsbereichen gut abschneiden.
Wie wir aus den Benchmarks gesehen haben, bietet GPT-5 einen bedeutenden Sprung in der Leistungsfähigkeit im Vergleich zu GPT-4.1 in den Bereichen Denken, Mathematik, Logik, Programmierung und anderen Arbeitsbereichen. Hier sind einige Beispiele, wo diese Verbesserungen in der realen Welt zur Geltung kommen:
*GPT 5 kontextualisiert Informationen besser. Bei der Datenextraktion, wie dem endgültigen USD-Betrag auf einer Rechnung ohne Währungsbezeichnungen, aber mit einer Adresse in London, antwortet GPT 5 korrekt, dass ein Umrechnungskurs von USD in GBP benötigt wird. Im Vergleich dazu sah GPT 4.1 die endgültige Rechnung und gab sie zurück, wobei es fälschlicherweise von der Währung ausging.
* GPT-5 liefert eine bessere multimodale Analyse. Für die Jahresmeldung eines öffentlichen Unternehmens wird GPT-5 gebeten, eine Zelle in einer Tabelle aus einem Bild zu isolieren, das Änderungen in den Eigenkapitalbestandteilen des Unternehmens zeigt. Der obere Teil der Tabelle stellt klar, dass alle Aktienbeträge in Tausenden angegeben sind, und GPT-5 gibt diese Umrechnung klar an, während GPT-4.1 dies nicht tut und verwirrt ist, da die Tabelle von Aktien spricht und die Legende von Anteilen.
* GPT-5 arbeitet besser mit hohen Anforderungen an Eingabeaufforderungen und Datenkomplexität. Bei der Datenextraktion aus einem Lebenslauf für alle Stellenanfangsdatums, Jobbezeichnungen und Arbeitgebernamen konnte GPT-5 jedes Datenstück herausziehen, während GPT-4.1 überfordert zu sein scheint und nicht die gleichen Felder extrahiert hat, angesichts der Größe der Eingabeaufforderung und der Komplexität des Dokuments.
* GPT-5 ist in seinen Antworten viel klarer und expliziter. In einem Outsourcing-Vertrag, in dem 6 verschiedene Dienstleistungen ausdrücklich besprochen werden, wird, wenn nach „den 5 spezifischen Dienstleistungen im Vertrag“ gefragt wird, GPT-5 die ersten 5 zurückgeben und fragen, ob es beabsichtigt war, dass die sechste nicht angesprochen wurde. Im Vergleich dazu gab GPT-4.1 einfach die ersten 5 ohne weitere Vorbehalte zurück, was zu Verwirrung für den Benutzer führen kann.
* GPT-5 ist besser in der Dateninterpretation in komplexen Bereichen. Für ein Flusszytometrie-Diagramm, das typischerweise in der Immunologie verwendet wird, identifizierte GPT-5 korrekt einen hohen Anteil an toten Zellen und gab plausible Ursachen an, die zu dieser Situation führen könnten, während GPT-4.1 minimale Begründungen lieferte und weitere Bestätigungen benötigte, um aus Rohdaten Vermutungen anzustellen.
* GPT-5 kann Inkonsistenzen im Code besser identifizieren. Wenn es darum gebeten wird, Probleme in einer gegebenen Python-Code-Datei zu identifizieren, können sowohl GPT-5 als auch 4.1 echte Fehler erkennen, die zu Fehlfunktionen führen, aber nur GPT-5 war in der Lage, subtilere Probleme zu erkennen, wie das Drucken der falschen Variablen, wenn dies im Kontext des Programms keinen Sinn ergeben würde.
Diese Verbesserungen in Mathematik, Denken, Logik und der Qualität der Antworten in längeren Kontextfenstern sind für Endbenutzer in der täglichen Arbeit unglaublich hilfreich, werden aber noch deutlicher bei länger laufenden KI-Agenten, insbesondere wenn kein Mensch in der Schleife ist, um die Informationen in jedem Schritt zu überprüfen.
Es ist großartig zu sehen, dass diese Verbesserungen in der neuesten Generation von KI-Modellen weiterhin kommen, da dies zu KI-Agenten führen wird, die in zunehmend kritischeren Arbeitsbereichen eingesetzt werden können.
77,96K
Top
Ranking
Favoriten