🚨 DeepSeek çılgın bir şey yaptı. Sadece problemleri çözmekle kalmıyor, kendi ispatlarını kontrol eden, kendini eleştiren, mantığı düzelten ve tek bir hata bulamayınca tekrar deneyen bir matematik model inşa ettiler. Son kısım, kendi mantığını doğrulamadan önce doğrulayabilen bir modelin çığırı. Ve sonuçlar saçma: • IMO 2025'te altın seviyesinde performans • CMO 2024'te altın seviyede performans • Putnam 2024'te 118/120 neredeyse kusurlu, tüm insan puanlarını geçti • En zor kategorilerde GPT-5 Thinking ve Gemini 2.5 Pro'dan üstün başarı gösterir DeepSeek Math V2'yi çılgın yapan şey doğruluk değil, arkasındaki mimaridir. Daha büyük modellerin ya da uzun düşünce zincirinin peşinden koşmadılar. Bir ekosistem inşa ettiler: ✓ mantıksal boşlukları arayan özel bir doğrulayıcı ✓ doğrulayıcının halüsinasyon yapıp görmediğini kontrol eden bir meta-doğrulayıcı ✓ kötü akıl yürütmekten korkmayı öğrenen bir kanıt üreticisi ✓ ve modelin doğrulamayı geliştirmeye zorlayan daha zor kanıtlar ürettiği bir eğitim döngüsü Döngü acımasız: Oluşturun → Doğrulayın → Meta-doğrulama → Düzeltin → Tekrarlayın. Çözdükleri temel mesele: nihai cevabın doğruluğu, teorem ispatında hiçbir şey ifade etmiyor. Doğru numarayı çöp mantıkla bulabilirsiniz. Bu yüzden bir doğrulayıcıyı kanıtın kendisini değerlendirmesi için eğittiler, nihai cevabı değil. ...