Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🚨 DeepSeek только что сделала что-то дикие.
Они создали математическую модель, которая не просто решает задачи, она проверяет свои собственные доказательства, критикует себя, исправляет логику и пытается снова, пока не найдет ни одной ошибки.
Эта последняя часть — прорыв: модель, которая может проверять свое собственное рассуждение, прежде чем вы его проверите.
И результаты просто невероятные:
• Золотой уровень на IMO 2025
• Золотой уровень на CMO 2024
• 118/120 на Putnam 2024 почти идеально, обгоняя все человеческие результаты
• Превосходит GPT-5 Thinking и Gemini 2.5 Pro в самых сложных категориях
Что делает DeepSeek Math V2 безумным, так это архитектура, стоящая за этим.
Они не гнались за большими моделями или более длинной цепочкой рассуждений.
Они создали экосистему:
✓ специализированный проверяющий, который ищет логические пробелы
✓ мета-проверяющий, который проверяет, не галлюцинирует ли проверяющий
✓ генератор доказательств, который учится бояться плохого рассуждения
✓ и цикл обучения, где модель продолжает генерировать более сложные доказательства, которые заставляют проверяющего развиваться
Цикл жестокий:
Генерировать → Проверить → Мета-проверить → Исправить → Повторить.
Основная проблема, которую они решили: точность конечного ответа ничего не значит в доказательстве теорем. Вы можете получить правильное число с мусорной логикой. Поэтому они обучили проверяющего судить о самом доказательстве, а не о конечном ответе.
...

Топ
Рейтинг
Избранное

