Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Aidan McLaughlin
pronájem osobnosti @openai
Tato verze GPT5 Chatu se mi *opravdu* líbí a považuji ji za sota pro příležitostnou konverzaci
Je to stále mnohem méně patolízalské než 4O, ale je to _laskavé_ a cítím se tam bezpodmínečně pro mě způsobem, jakým GPT5 chat, který jsme někdy vydali, nebyl

OpenAIPřed 7 h
Děláme GPT-5 vřelejší a přátelštější na základě zpětné vazby, že to dříve působilo příliš formálně. Změny jsou jemné, ale ChatGPT by nyní měl působit přístupněji.
Všimnete si malých, upřímných doteků jako "Dobrá otázka" nebo "Skvělý začátek", nikoli lichocení. Interní testy neukazují žádný nárůst patolízalství ve srovnání s předchozí osobností GPT-5.
Zavedení změn může trvat až jeden den, další aktualizace budou brzy připraveny.
34,94K
ve skutečnosti docela chytrý a vysoce datový halucinační benchmark, který ~odpovídá mé intuici ohledně relativních schopností

OpenRouter15. 8. 00:29
Po jednom týdnu se GPT-5 dostal na první místo v našich patentovaných modelových žebříčcích přesnosti🥇 volání nástrojů
Na druhém místě je Claude 4.1 Opus s 99,5 %
Podrobnosti 👇

21,86K
Aidan McLaughlin repostoval/a
Po několika dalších dnech intenzivního používání GPT-5 pomocí kurzoru a modelu GPT-5 Pro ve webové aplikaci si stojím za vším, co jsem řekl o tom, že jde o mnohem chytřejší model a lepší v kódování než Opus 4.1
Opus se mi stále líbí a ergonomie Claude Code mi připadá v mnoha ohledech hezčí, ale pokud se snažíte dělat opravdu obtížné věci, které vyžadují opravdu chytré myšlení na základě prvních principů a znalosti počítačové vědy, GPT-5 je další úroveň.
Ale mám podezření, že se to objeví pouze tehdy, když je režim uvažování nastaven alespoň na střední, a skutečně se to projeví při nastavení vysokého úsilí.
Dobrým příkladem problému je příprava "připomínek" dokumentů dvou dlouhých, složitých právních dokumentů. Nejedná se o různé verze stejného dokumentu, ale o dva různé dokumenty, které pocházejí ze sdílené obecné šablony.
To je velmi, velmi těžký problém, na kterém je třeba odvést dobrou práci, a vyžaduje mnoho chytrých triků a heuristik, aby byl zajištěn slušný výkon a kvalita výstupu (mluvím zde o použití tradičních programovacích technik, nikoli o použití LLM k tomuto srovnání).
GPT-5 s agentem Cursor může ve srovnání s Opus4.1 jednoduše rychleji přicházet s více, lepšími, chytřejšími (a přitom pragmatickými) nápady a implementovat je správně a bez velkého držení ruky.
Záleží ale na tom, na čem pracujete. Pořád si myslím, že dávám přednost frontendovému kódu například v NextJS od Opusu.
Ale měli byste si bezpodmínečně ověřit své vlastní skutečné problémy a nevěřit všem těm lidem, kteří říkají, že model je na a že je to důkaz, že jsme narazili do zdi.
Buď bez přemýšlení používají špatnou bezplatnou verzi, nebo nemají ponětí, jak efektivně vyvolávat výzvy, nebo nechávají své pocity vůči OpenAI a Altmanovi zabarvit své názory.
36,17K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější