Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
In Box, trascorriamo molto tempo a testare Box AI con nuovi modelli su dati non strutturati per vedere in quali aree di lavoro conoscitivo si comportano meglio.
Come abbiamo visto dai benchmark, GPT-5 offre un salto significativo nelle capacità rispetto a GPT-4.1 in ragionamento, matematica, logica, programmazione e altre aree di lavoro. Ecco alcuni esempi di come questi miglioramenti si manifestano nel mondo reale:
*GPT 5 contestualizza meglio le informazioni. Quando si esegue l'estrazione dei dati come l'importo finale in USD su una fattura senza etichette di valuta ma con un indirizzo a Londra, GPT 5 risponde correttamente che è necessaria una conversione da USD a GBP. In confronto, GPT 4.1 ha visto la fattura finale e l'ha restituita, assumendo la valuta (in modo errato).
* GPT-5 offre una migliore analisi multimodale. Per la dichiarazione annuale di una società pubblica, a GPT-5 viene chiesto di isolare una cella in una tabella da un'immagine che mostra le variazioni nei componenti del capitale della società. La parte superiore della tabella chiarisce che tutti gli importi delle azioni sono in migliaia, e GPT-5 dichiara chiaramente questa conversione, mentre GPT-4.1 non lo fa, confondendosi dato che la tabella dice azioni e la legenda dice quote.
* GPT-5 si comporta meglio con alti livelli di complessità nei prompt e nei dati. Quando si esegue l'estrazione dei dati su un curriculum per tutte le date di inizio lavoro, i nomi delle posizioni lavorative e i nomi dei datori di lavoro, GPT-5 è stato in grado di estrarre ogni pezzo di dato mentre GPT-4.1 sembra essere sopraffatto e non ha estratto gli stessi campi data la dimensione del prompt e la complessità del documento.
* GPT-5 è molto più chiaro ed esplicito nelle sue risposte. In un accordo di outsourcing con 6 diversi servizi esplicitamente discussi, quando viene chiesto riguardo ai "5 servizi specifici nel contratto", GPT-5 restituirà i primi 5 e chiederà se era intenzionale che il sesto non fosse stato menzionato. In confronto, GPT-4.1 ha semplicemente restituito i primi 5 senza ulteriori avvertenze, il che può portare a confusione per l'utente.
* GPT-5 è migliore nell'interpretazione dei dati in campi complessi. Per un grafico di citometria a flusso, tipicamente usato in immunologia, GPT-5 ha identificato correttamente un'alta proporzione di cellule morte e ha fornito cause plausibili che potrebbero portare a tale situazione, mentre GPT-4.1 ha fornito ragionamenti minimi, necessitando di ulteriori conferme per avere delle ipotesi dai dati grezzi.
* GPT-5 è migliore nell'identificare incoerenze nel codice. Quando viene chiesto di identificare problemi in un dato file di codice python, mentre sia GPT-5 che 4.1 possono identificare errori reali che portano a malfunzionamenti, solo GPT-5 è stato in grado di dedurre problemi più sottili, come stampare la variabile errata quando ciò non avrebbe senso nel contesto del programma.
Questi miglioramenti in matematica, ragionamento, logica e qualità delle risposte in finestre di contesto più lunghe sono incredibilmente utili per gli utenti finali nel lavoro quotidiano, ma si manifesteranno ancora di più con agenti AI a lungo termine, specialmente quando non c'è un umano nel loop per verificare le informazioni a ogni passaggio.
È fantastico vedere che questi miglioramenti continuano ad arrivare nei più recenti modelli di AI, poiché ciò porterà a agenti AI in grado di essere utilizzati in aree di lavoro sempre più critiche.
72,41K
Principali
Ranking
Preferiti