Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Robert Youssef
Sakra... tohle může být nejneskutečnější akademický posun v psaní, jaký jsem kdy viděl 🤯
Tým z NUS právě zveřejnil PaperDebugger, systém s více agenty v editoru, který je uvnitř Overleafu a přepisuje váš článek v reálném čase.
Ne kopírovat a vkládat. Ne chatbot na postranním panelu.
Skutečná agentická úprava přímo ve vašem LaTeX editoru.
Tady je důvod, proč je to šílené 👇
→ Zvýrazníte nepořádný odstavec a spustí se kompletní pipeline kritiky + přepisování
→ Vrátí čisté před–po diffy jako Git a pak dokument okamžitě opraví
→ Paralelně provozuje agenty Recenzenta, Zlepšovatele, Hodnocení a Výzkumníka
→ Používá Kubernetes pody ke škálování multiagentního uvažování uvnitř editoru
→ Využívá nástroj MCP pro vyhledávání literatury, vyhledávání referencí a rozšiřování na úrovni sekcí
Režim hlubokého výzkumu je ještě šílenější:
Stáhne relevantní arXiv články, shrne je, porovná vaši metodu s nimi a vygeneruje tabulky připravené k citacím... Vše v linii během psaní.
Je to v podstatě mini komise recenzentů, kteří jsou součástí vašeho dokumentu, přepisují, kritizují, hledají zdroje a leštítí, aniž by kdy narušili plynulost.
Pokud se to rozšíří, Overleaf přestane být editorem... a stává se plně výzkumným prostředím podporovaným AI.

1,06M
Právě vyšla skvělá práce ze Stanfordovy univerzity o latentní spolupráci a navždy změnila náš pohled na multiagentní zpravodajství.
"Latentní spolupráce v systémech s více agenty" ukazuje, že agenti mohou koordinovat bez komunikačních kanálů, předdefinovaných rolí nebo jakýchkoli explicitních pokynů pro týmovou spolupráci. Vymýšlejí skryté vnitřní signály uvnitř svých politických sítí, kterým rozumí jen ostatní agenti.
Je divoké sledovat, co se z toho objeví:
• Agenti rozdělují úkoly bez jakéhokoliv vedení
• Role tvořící se tiše uvnitř latentního prostoru
• Slabí agenti ustupují, zatímco silnější přebírají kontrolu
• Skryté vyjednávací signály, které se nikdy neobjeví v pozorovatelných akcích
• Koordinační strategie, které se mění podle prostředí
To, co na povrchu vypadá jako jednoduché chování, je ve skutečnosti celý tajný "jazyk", který se uvnitř modelů formuje.
Nejšokující část?
Testovali scénáře, aniž by agentům poskytli jakékoliv komunikační nástroje... a spolupráce se stále objevovala. Čistě kvůli tlaku na trénink a sdíleným odměnám.
Toto je náhled na to, kam agentická AI směřuje:
Týmy, které koordinují instinktivně, ne mechanicky.
Agenti, kteří spolupracují způsobem, jakým to dělají biologické systémy, ne proto, že jim to bylo řečeno, ale protože se tato strategie přirozeně objeví.
Pokud vám záleží na autonomních systémech, posilovaném učení nebo multiagentní AI... Tahle kniha je povinná četba.

9,63K
🚨 DeepSeek prostě udělal něco divokého.
Vytvořili matematický model, který nejen řeší problémy, ale kontroluje své vlastní důkazy, kritizuje sám sebe, opravuje logiku a zkouší to znovu, dokud nenajde jedinou chybu.
Ta poslední část je průlom – model, který dokáže ověřit své vlastní uvažování dříve, než ho ověříte vy.
A výsledky jsou absurdní:
• Zlatá úroveň na IMO 2025
• Zlatá úroveň na CMO 2024
• 118/120 na Putnam 2024 téměř dokonalé, překonávající všechny lidské skóre
• Překonává GPT-5 Thinking a Gemini 2.5 Pro v nejtěžších kategoriích
To, co dělá DeepSeek Math V2 bláznivou, není přesnost, ale architektura za ní.
Nehonili větší modelky ani delší myšlenkové řetězce.
Vybudovali ekosystém:
✓ oddaný ověřovatel, který hledá logické mezery
✓ meta-ověřovač, který kontroluje, zda ověřovatel halucinuje
✓ generátor důkazů, který se učí bát špatného uvažování
✓ a tréninkovou smyčku, kde model neustále generuje tvrdší důkazy, které nutí ověřovatele k evoluci
Cyklus je krutý:
Generujte → Ověřujte → Meta-ověřujte → Opravte → Opakujte.
Hlavní problém, který vyřešili: přesnost konečné odpovědi neznamená nic v dokazování vět. Správné číslo lze získat pomocí špatné logiky. Proto vycvičili ověřovatele, aby posuzoval samotný důkaz, ne konečnou odpověď.
Graf porovnávající přesnost důkazů napříč algebrou, geometrií, kombinatorikou, teorií čísel a nerovnostmi ukazuje, že DeepSeekMath-V2 poráží jak GPT-5 Thinking, tak Gemini 2.5 Pro ve všech ohledech (toto je na straně 7).
Divoká část je sekvenční sebezdokonalování. S každou iterací stoupá vlastní proof score modelu, protože se stále ladí bez lidské zpětné vazby.
Tohle není "delší řetězec myšlenek".
To je "Budu přemýšlet, dokud si nebudu jistý, že mám pravdu."
Skutečný posun v tom, jak trénujeme modely uvažování.
DeepSeek v podstatě dokázal, že samoověřitelné uvažování je možné v přirozeném jazyce – bez formálního asistenta důkazů, bez lidských stop, jen model, který se učí nedůvěřovat vlastnímu výstupu.
Pokud vás zajímá uvažování o AI, tento článek je zlomovým bodem.

139,25K
Top
Hodnocení
Oblíbené
