СРОЧНО: Потребительская версия Aristotle побеждает Putnam, решая и формально проверяя 10 из 12 задач в @leanprover. Поздравляем любителя математики @namrata_anand2, который использовал потребительскую версию Aristotle с ранним публичным релизом задач. Похоже, что Aristotle справился с ними на завтрак, решив 10 из 12 полностью автономно. В настоящее время мы изучаем файлы и поделимся более подробной информацией позже, но сейчас стоит отметить две полезные вещи: ▪️Похоже, что это первые полностью формализованные решения задач Putnam 2025 года, выпущенные публично. ▪️Все они использовали недавно выпущенный интерфейс на естественном языке, в котором Aristotle получил вопрос на естественном языке, затем автоформализовал его в утверждение Lean4 и затем завершил доказательство, полностью автономно, без участия человека. В прошлом мы сосредотачивались на передовых возможностях доказательства теорем Aristotle, но он также становится довольно способным в автоформализации. Мы вступаем в новую эру для ИИ и математики. Постепенно... а затем сразу!