Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ve společnosti Box trávíme spoustu času testováním umělé inteligence Boxu s novými modely na nestrukturovaných datech, abychom zjistili, v čem si vedou dobře v reálných oblastech znalostní práce.
Jak jsme viděli z benchmarků, GPT-5 nabízí významný skok ve schopnostech oproti GPT-4.1 v uvažování, matematice, logice, kódování a dalších oblastech práce. Zde je několik příkladů, kde se tato vylepšení projevují v reálném světě:
*GPT 5 lépe kontextualizuje informace. Při extrakci dat, jako je konečná částka v USD na faktuře bez štítků měny, ale s adresou v Londýně, GPT 5 správně odpoví a potřebuje směnný kurz z USD na GBP. Pro srovnání, GPT 4.1 viděl konečný účet a vrátil jej, přičemž předpokládal měnu (nesprávně).
* GPT-5 poskytuje lepší multimodální analýzu. Pro každoroční podání veřejné společnosti je GPT-5 požádán, aby izoloval buňku v tabulce od obrázku zobrazujícího změny ve složkách vlastního kapitálu společnosti. V horní části tabulky je objasněno, že všechny částky akcií jsou v tisících a GPT-5 tento převod jasně uvádí, zatímco GPT-4.1 nikoli, což je zmatené, protože v tabulce je uvedeno akcie a legenda akcie.
* GPT-5 funguje lépe s vysokou úrovní promptu a složitosti dat. Při extrakci dat z životopisu pro všechna data nástupu do zaměstnání, názvy pracovních pozic a názvy zaměstnavatelů byl GPT-5 schopen vytáhnout všechna data, zatímco GPT-4.1 se zdá být zahlcen a neextrahoval stejná pole vzhledem k velikosti výzvy a složitosti dokumentu.
* GPT-5 je ve svých odpovědích mnohem jasnější a explicitnější. Ve smlouvě o outsourcingu, kde je výslovně diskutováno 6 různých služeb, když je GPT-5 dotázán na "5 konkrétních služeb ve smlouvě", vrátí prvních 5 a zeptá se, zda bylo záměrné, že na šestou se nezeptal. Pro srovnání, GPT-4.1 jednoduše vrátil prvních 5 bez dalších upozornění, což může vést ke zmatkům pro uživatele.
* GPT-5 je lepší v interpretaci dat ve složitých oblastech. Pro graf průtokové cytometrie, který se obvykle používá v imunologii, GPT-5 správně identifikoval vysoký podíl mrtvých buněk a uvedl věrohodné základní příčiny, které by mohly vést k situaci, zatímco GPT-4.1 poskytl minimální zdůvodnění a potřeboval další potvrzení, aby bylo možné provést jakékoli odhady z hrubých dat.
* GPT-5 dokáže lépe identifikovat nesrovnalosti v kódu. Když byl GPT-5 i 4.1 požádán, aby identifikoval problémy v daném souboru kódu Pythonu, zatímco GPT-5 i 4.1 dokážou identifikovat skutečné chyby, které vedou k poruše, pouze GPT-5 dokázal odvodit jemnější problémy, jako je tisk nesprávné proměnné, když by to v kontextu programu nedávalo smysl.
Tato vylepšení v matematice, uvažování, logice a kvalitě odpovědí v delších kontextových oknech jsou neuvěřitelně užitečná pro koncové uživatele v každodenní práci, ale ještě více se projeví u déle běžících agentů umělé inteligence, zejména když ve smyčce není žádný člověk, který by ověřoval informace na každém kroku.
Je úžasné vidět, že tato vylepšení stále přicházejí v nejnovější úrodě modelů umělé inteligence, protože to povede k tomu, že agenty umělé inteligence bude možné používat v postupně kritičtějších oblastech práce.
77,95K
Top
Hodnocení
Oblíbené