Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
På Box lägger vi mycket tid på att testa Box AI med nya modeller på ostrukturerad data för att se vad de presterar bra på inom verkliga kunskapsområden.
Som vi har sett i benchmarks erbjuder GPT-5 ett meningsfullt hopp i kapacitet jämfört med GPT-4.1 när det gäller resonemang, matematik, logik, kodning och andra arbetsområden. Här är några exempel på var dessa förbättringar kommer till användning i den verkliga världen:
*GPT 5 kontextualiserar information bättre. När man extraherar data, t.ex. det slutliga USD-beloppet på en faktura utan valutaetiketter men med en adress i London, svarar GPT 5 korrekt och behöver en konverteringskurs från USD till GBP. Som jämförelse såg GPT 4.1 den slutliga räkningen och returnerade den, med antagandet att valutan var (felaktigt).
* GPT-5 ger bättre multimodal analys. För ett börsnoterat företags årsredovisning ombeds GPT-5 att isolera en cell i en tabell från en bild som visar förändringar i företagets aktiekomponenter. Överst i tabellen klargörs att alla aktiebelopp är i tusental, och GPT-5 anger tydligt denna omvandling, medan GPT-4.1 inte gör det, vilket gör dig förvirrad med tanke på att tabellen säger aktier och legenden säger aktier.
* GPT-5 presterar bättre med höga nivåer av prompt- och datakomplexitet. När man extraherade data på ett CV för alla jobbstartdatum, jobbpositionsnamn och arbetsgivarnamn kunde GPT-5 ta fram alla data medan GPT-4.1 verkar bli överväldigad och inte extraherade samma fält med tanke på storleken på prompten och dokumentets komplexitet.
* GPT-5 är mycket tydligare och tydligare i sina svar. I ett outsourcingavtal med 6 olika tjänster som uttryckligen diskuteras, när man tillfrågas om "de 5 specifika tjänsterna i kontraktet", kommer GPT-5 att returnera de första 5 och fråga om det var avsiktligt att den sjätte inte tillfrågades om. Som jämförelse returnerade GPT-4.1 helt enkelt de första 5 utan några ytterligare varningar, vilket kan leda till förvirring nedströms för användaren.
* GPT-5 är bättre på att tolka data inom komplexa områden. För ett flödescytometridiagram, som vanligtvis används inom immunologi, identifierade GPT-5 korrekt en hög andel döda celler och gav troliga grundorsaker som kan leda till situationen medan GPT-4.1 gav minimalt resonemang och behövde ytterligare bekräftelse för att ha några gissningar från rådata.
* GPT-5 är bättre på att identifiera inkonsekvenser i kod. När både GPT-5 och 4.1 ombads att identifiera problem i en viss python-kodfil var det bara GPT-5 som kunde identifiera verkliga fel som leder till fel, men det var bara GPT-5 som kunde dra slutsatser om mer subtila problem, som att skriva ut den felaktiga variabeln när det inte skulle vara meningsfullt i programmets sammanhang.
Dessa förbättringar av matematik, resonemang, logik och kvaliteten på svaren i längre kontextfönster är otroligt användbara för slutanvändare i det dagliga arbetet, men de kommer att dyka upp ännu mer med AI-agenter som körs längre, särskilt när det inte finns någon människa i loopen för att verifiera informationen i varje steg.
Det är fantastiskt att se att dessa förbättringar fortsätter att komma i den senaste skörden av AI-modeller eftersom detta kommer att leda till att AI-agenter kan användas i stegvis mer verksamhetskritiska arbetsområden.
72,39K
Topp
Rankning
Favoriter