DApp Store | Centrum Web3 pro události a hry

Populární témata

🚨 DeepSeek prostě udělal něco divokého. Vytvořili matematický model, který nejen řeší problémy, ale kontroluje své vlastní důkazy, kritizuje sám sebe, opravuje logiku a zkouší to znovu, dokud nenajde jedinou chybu. Ta poslední část je průlom – model, který dokáže ověřit své vlastní uvažování dříve, než ho ověříte vy. A výsledky jsou absurdní: • Zlatá úroveň na IMO 2025 • Zlatá úroveň na CMO 2024 • 118/120 na Putnam 2024 téměř dokonalé, překonávající všechny lidské skóre • Překonává GPT-5 Thinking a Gemini 2.5 Pro v nejtěžších kategoriích To, co dělá DeepSeek Math V2 bláznivou, není přesnost, ale architektura za ní. Nehonili větší modelky ani delší myšlenkové řetězce. Vybudovali ekosystém: ✓ oddaný ověřovatel, který hledá logické mezery ✓ meta-ověřovač, který kontroluje, zda ověřovatel halucinuje ✓ generátor důkazů, který se učí bát špatného uvažování ✓ a tréninkovou smyčku, kde model neustále generuje tvrdší důkazy, které nutí ověřovatele k evoluci Cyklus je krutý: Generujte → Ověřujte → Meta-ověřujte → Opravte → Opakujte. Hlavní problém, který vyřešili: přesnost konečné odpovědi neznamená nic v dokazování vět. Správné číslo lze získat pomocí špatné logiky. Proto vycvičili ověřovatele, aby posuzoval samotný důkaz, ne konečnou odpověď. ...

Top

Hodnocení

Oblíbené