Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 DeepSeek prostě udělal něco divokého.
Vytvořili matematický model, který nejen řeší problémy, ale kontroluje své vlastní důkazy, kritizuje sám sebe, opravuje logiku a zkouší to znovu, dokud nenajde jedinou chybu.
Ta poslední část je průlom – model, který dokáže ověřit své vlastní uvažování dříve, než ho ověříte vy.
A výsledky jsou absurdní:
• Zlatá úroveň na IMO 2025
• Zlatá úroveň na CMO 2024
• 118/120 na Putnam 2024 téměř dokonalé, překonávající všechny lidské skóre
• Překonává GPT-5 Thinking a Gemini 2.5 Pro v nejtěžších kategoriích
To, co dělá DeepSeek Math V2 bláznivou, není přesnost, ale architektura za ní.
Nehonili větší modelky ani delší myšlenkové řetězce.
Vybudovali ekosystém:
✓ oddaný ověřovatel, který hledá logické mezery
✓ meta-ověřovač, který kontroluje, zda ověřovatel halucinuje
✓ generátor důkazů, který se učí bát špatného uvažování
✓ a tréninkovou smyčku, kde model neustále generuje tvrdší důkazy, které nutí ověřovatele k evoluci
Cyklus je krutý:
Generujte → Ověřujte → Meta-ověřujte → Opravte → Opakujte.
Hlavní problém, který vyřešili: přesnost konečné odpovědi neznamená nic v dokazování vět. Správné číslo lze získat pomocí špatné logiky. Proto vycvičili ověřovatele, aby posuzoval samotný důkaz, ne konečnou odpověď.
...

Top
Hodnocení
Oblíbené

