Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

Сегодня мы объявляем о запуске Kosmos, нашего нового AI Scientist, который доступен для использования прямо сейчас. Пользователи оценивают, что Kosmos выполняет 6 месяцев работы за один день. Один запуск может прочитать 1,500 статей и написать 42,000 строк кода. По крайней мере, 79% его находок воспроизводимы. Kosmos сделал 7 открытий на данный момент, которые мы публикуем сегодня, в областях от нейробиологии до материаловедения и клинической генетики, в сотрудничестве с нашими академическими бета-тестерами. Три из этих открытий воспроизвели неопубликованные результаты; четыре являются новыми, проверенными вкладом в научную литературу. Научные исследования с ускорением AI уже здесь. Наше основное новшество в Kosmos заключается в использовании структурированной, постоянно обновляемой модели мира. Как описано в нашем техническом отчете, модель мира Kosmos позволяет ему обрабатывать порядки величины больше информации, чем может вместить даже самая длинная языковая модель, что позволяет ему синтезировать больше информации и преследовать последовательные цели на более длительных временных горизонтах, чем Robin или любые другие наши предыдущие агенты. В этом отношении мы считаем, что Kosmos является самым вычислительно интенсивным языковым агентом, выпущенным до сих пор в любой области, и, безусловно, самым способным AI Scientist, доступным сегодня. Использование постоянной модели мира также позволяет отдельным траекториям Kosmos производить высоко сложные результаты, которые требуют нескольких значительных логических скачков. Как и все наши системы, Kosmos разработан с учетом прозрачности и проверяемости: каждое заключение в отчете Kosmos можно проследить через нашу платформу до конкретных строк кода или конкретных отрывков в научной литературе, которые его вдохновили, что гарантирует, что находки Kosmos всегда полностью подлежат аудиту. Мы также используем эту возможность, чтобы объявить о запуске Edison Scientific, нового коммерческого спин-аута FutureHouse, который будет сосредоточен на коммерциализации наших агентов и применении их для автоматизации научных исследований в области открытия лекарств и не только. Edison возьмет на себя управление платформой FutureHouse, где вы можете получить доступ к Kosmos наряду с нашими агентами Literature, Molecules и Precedent (ранее Crow, Phoenix и Owl). Edison продолжит предлагать бесплатное использование для случайных пользователей и академиков, а также предложит более высокие лимиты и дополнительные функции для пользователей, которым они нужны. Вы можете прочитать больше об этом спин-аутах в нашем блоге ниже. Несколько важных замечаний, если вы собираетесь попробовать Kosmos. Во-первых, Kosmos отличается от многих других AI инструментов, с которыми вы могли работать, включая наших других агентов. Он больше похож на инструмент глубоких исследований, чем на чат-бота: требуется некоторое время, чтобы понять, как эффективно его запрашивать, и мы постарались включить рекомендации по этому поводу (см. ниже). В данный момент это стоит $200/запуск (200 кредитов за запуск и $1/кредит), с некоторым бесплатным использованием для академиков. Это сильно сниженная цена; люди, которые подписываются на Основные Подписки сейчас, могут зафиксировать цену $1/кредит на неопределенный срок, но в конечном итоге цена, вероятно, будет выше. Снова, это меньше чат-бот и больше исследовательский инструмент, что-то, что вы запускаете на высокоценных объектах по мере необходимости. Некоторые предостережения также уместны. Во-первых, мы обнаружили, что 80% находок Kosmos воспроизводимы, что также означает, что 20% не воспроизводимы — некоторые вещи, которые он говорит, будут неверными. Кроме того, Kosmos, безусловно, производит результаты, эквивалентные нескольким месяцам человеческого труда, но он также часто уходит в «кроличьи норы» или преследует статистически значимые, но научно несущественные находки. Мы часто запускаем Kosmos несколько раз по одной и той же цели, чтобы исследовать различные исследовательские направления, которые он может взять. На интерфейсе и подобном все еще есть множество шероховатостей, над которыми мы работаем. Наконец, мы осознаем, что цифра в 6 месяцев значительно превышает оценки других AI лабораторий, таких как METR, о длине задач, которые AI агенты могут в настоящее время выполнять. Вы можете прочитать обсуждение об этом в нашем блоге. Огромные поздравления нашей команде, которая это собрала, под руководством @ludomitch и @michaelathinks: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Особая благодарность @m_skarlinski и его команде, которые восстановили платформу для этого запуска, особенно Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 и другим. Эта работа не была бы возможна без значительных вкладов от академических коллег @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani и @RandallBateman3. Мы также хотим поблагодарить наших многочисленных сторонников, особенно @ericschmidt, который был огромным союзником. Мы скоро скажем больше о наших сторонниках!

Топ

Рейтинг

Избранное