Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 DeepSeek właśnie zrobił coś szalonego.
Zbudowali model matematyczny, który nie tylko rozwiązuje problemy, ale także sprawdza swoje własne dowody, krytykuje siebie, naprawia logikę i próbuje ponownie, aż nie znajdzie ani jednej wady.
Ta ostatnia część to przełom – model, który może weryfikować swoje własne rozumowanie, zanim ty je zweryfikujesz.
A wyniki są absurdalne:
• Wydajność na poziomie złota w IMO 2025
• Wydajność na poziomie złota w CMO 2024
• 118/120 w Putnam 2024, niemal doskonałe, bijąc każdy ludzki wynik
• Przewyższa GPT-5 Thinking i Gemini 2.5 Pro w najtrudniejszych kategoriach
To, co sprawia, że DeepSeek Math V2 jest szalone, to nie dokładność, ale architektura, która za tym stoi.
Nie gonili za większymi modelami ani dłuższym łańcuchem myślenia.
Zbudowali ekosystem:
✓ dedykowany weryfikator, który poluje na luki logiczne
✓ meta-weryfikator, który sprawdza, czy weryfikator nie halucynuje
✓ generator dowodów, który uczy się bać złej logiki
✓ oraz pętla treningowa, w której model ciągle generuje trudniejsze dowody, które zmuszają weryfikator do ewolucji
Cykl jest brutalny:
Generuj → Weryfikuj → Meta-weryfikuj → Napraw → Powtórz.
Główny problem, który rozwiązali: dokładność odpowiedzi końcowej nic nie znaczy w dowodzeniu twierdzeń. Możesz uzyskać właściwą liczbę przy złej logice. Dlatego wytrenowali weryfikator, aby ocenił sam dowód, a nie odpowiedź końcową.
...

Najlepsze
Ranking
Ulubione

