Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 DeepSeek baru saja melakukan sesuatu yang liar.
Mereka membangun model matematika yang tidak hanya memecahkan masalah, tetapi memeriksa buktinya sendiri, mengkritik dirinya sendiri, memperbaiki logika, dan mencoba lagi sampai tidak dapat menemukan satu kekurangan.
Bagian terakhir itu adalah terobosan, model yang dapat memverifikasi alasannya sendiri sebelum Anda memverifikasinya.
Dan hasilnya konyol:
• Kinerja tingkat emas pada IMO 2025
• Kinerja tingkat emas pada CMO 2024
• 118/120 pada Putnam 2024 hampir sempurna, mengalahkan setiap skor manusia
• Mengungguli GPT-5 Thinking dan Gemini 2.5 Pro pada kategori tersulit
Apa yang membuat DeepSeek Math V2 gila bukanlah akurasi, melainkan arsitektur di baliknya.
Mereka tidak mengejar model yang lebih besar atau rantai pemikiran yang lebih panjang.
Mereka membangun ekosistem:
✓ Verifikator khusus yang memburu celah logis
✓ Meta-verifier yang memeriksa apakah verifikator berhalusinasi
✓ generator bukti yang belajar takut penalaran yang buruk
✓ dan loop pelatihan di mana model terus menghasilkan bukti yang lebih keras yang memaksa verifikator untuk berevolusi
Siklusnya brutal:
Hasilkan → Verifikasi → Verifikasi Meta → Perbaiki → Ulangi.
Masalah inti yang mereka pecahkan: akurasi jawaban akhir tidak berarti apa-apa dalam teorema yang membuktikan. Anda bisa mendapatkan nomor yang tepat dengan logika sampah. Jadi mereka melatih seorang verifikator untuk menilai bukti itu sendiri, bukan jawaban akhir.
...

Teratas
Peringkat
Favorit

