Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 DeepSeek a făcut pur și simplu ceva nebunesc.
Au construit un model matematic care nu doar rezolvă probleme, ci își verifică propriile demonstrații, se critică singur, corectează logica și încearcă din nou până nu găsește niciun defect.
Acea ultimă parte este descoperirea, un model care își poate verifica propriul raționament înainte ca tu să-l verifici.
Și rezultatele sunt ridicole:
• Performanță de nivel aur la IMO 2025
• Performanță de nivel aur la CMO 2024
• 118/120 la Putnam 2024 aproape perfect, depășind orice scor uman
• Depășește GPT-5 Thinking și Gemini 2.5 Pro la cele mai dificile categorii
Ceea ce face ca DeepSeek Math V2 să fie nebun nu este acuratețea, ci arhitectura din spatele lui.
Nu urmăreau modele mai mari sau un lanț de gândire mai lung.
Ei au construit un ecosistem:
✓ un verificator dedicat care caută lacune logice
✓ un meta-verificator care verifică dacă verificatorul are halucinații
✓ un generator de demonstrații care învață să se teamă de raționamentul prost
✓ și un ciclu de antrenament în care modelul continuă să genereze demonstrații mai dificile care forțează verificatorul să evolueze
Ciclul este brutal:
Generează → verifică → meta-verifică → corectează → repetă.
Problema de bază pe care au rezolvat-o: acuratețea răspunsului final nu înseamnă nimic în demonstrarea teoremelor. Poți obține numărul corect cu logică proastă. Așa că au antrenat un verificator să judece dovada în sine, nu răspunsul final.
...

Limită superioară
Clasament
Favorite

