Po několika dalších dnech intenzivního používání GPT-5 pomocí kurzoru a modelu GPT-5 Pro ve webové aplikaci si stojím za vším, co jsem řekl o tom, že jde o mnohem chytřejší model a lepší v kódování než Opus 4.1 Opus se mi stále líbí a ergonomie Claude Code mi připadá v mnoha ohledech hezčí, ale pokud se snažíte dělat opravdu obtížné věci, které vyžadují opravdu chytré myšlení na základě prvních principů a znalosti počítačové vědy, GPT-5 je další úroveň. Ale mám podezření, že se to objeví pouze tehdy, když je režim uvažování nastaven alespoň na střední, a skutečně se to projeví při nastavení vysokého úsilí. Dobrým příkladem problému je příprava "připomínek" dokumentů dvou dlouhých, složitých právních dokumentů. Nejedná se o různé verze stejného dokumentu, ale o dva různé dokumenty, které pocházejí ze sdílené obecné šablony. To je velmi, velmi těžký problém, na kterém je třeba odvést dobrou práci, a vyžaduje mnoho chytrých triků a heuristik, aby byl zajištěn slušný výkon a kvalita výstupu (mluvím zde o použití tradičních programovacích technik, nikoli o použití LLM k tomuto srovnání). GPT-5 s agentem Cursor může ve srovnání s Opus4.1 jednoduše rychleji přicházet s více, lepšími, chytřejšími (a přitom pragmatickými) nápady a implementovat je správně a bez velkého držení ruky. Záleží ale na tom, na čem pracujete. Pořád si myslím, že dávám přednost frontendovému kódu například v NextJS od Opusu. Ale měli byste si bezpodmínečně ověřit své vlastní skutečné problémy a nevěřit všem těm lidem, kteří říkají, že model je na a že je to důkaz, že jsme narazili do zdi. Buď bez přemýšlení používají špatnou bezplatnou verzi, nebo nemají ponětí, jak efektivně vyvolávat výzvy, nebo nechávají své pocity vůči OpenAI a Altmanovi zabarvit své názory.
35,61K