Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Hoy, anunciamos Kosmos, nuestro nuevo científico de IA, disponible para usar ahora.
Los usuarios estiman que Kosmos hace 6 meses de trabajo en un solo día. Una ejecución puede leer 1,500 artículos y escribir 42,000 líneas de código. Al menos el 79% de sus hallazgos son reproducibles. Kosmos ha realizado 7 descubrimientos hasta ahora, que estamos lanzando hoy, en áreas que van desde la neurociencia hasta la ciencia de los materiales y la genética clínica, en colaboración con nuestros probadores beta académicos. Tres de estos descubrimientos reprodujeron hallazgos inéditos; cuatro son contribuciones netas nuevas y validadas a la literatura científica. La ciencia acelerada por IA está aquí.
Nuestra principal innovación en Kosmos es el uso de un modelo mundial estructurado y continuamente actualizado. Como se describe en nuestro informe técnico, el modelo mundial de Kosmos le permite procesar órdenes de magnitud más información de la que podría caber en el contexto de incluso los modelos de lenguaje de contexto más largo, lo que le permite sintetizar más información y perseguir objetivos coherentes en horizontes de tiempo más largos que Robin o cualquiera de nuestros otros agentes anteriores. En este sentido, creemos que Kosmos es el agente lingüístico más intensivo en computación lanzado hasta ahora en cualquier campo y, con mucho, el científico de IA más capaz disponible en la actualidad. El uso de un modelo mundial persistente también permite que las trayectorias individuales de Kosmos produzcan resultados altamente complejos que requieren múltiples saltos lógicos significativos. Al igual que con todos nuestros sistemas, Kosmos está diseñado teniendo en cuenta la transparencia y la verificabilidad: cada conclusión de un informe de Kosmos se puede rastrear a través de nuestra plataforma hasta las líneas específicas de código o los pasajes específicos de la literatura científica que lo inspiraron, lo que garantiza que los hallazgos de Kosmos sean totalmente auditables en todo momento.
También aprovechamos esta oportunidad para anunciar el lanzamiento de Edison Scientific, una nueva escisión comercial de FutureHouse, que se centrará en comercializar nuestros agentes y aplicarlos para automatizar la investigación científica en el descubrimiento de fármacos y más allá. Edison se hará cargo de la gestión de la plataforma FutureHouse, donde podrás acceder a Kosmos junto con nuestros agentes de Literatura, Moléculas y Precedentes (anteriormente Cuervo, Fénix y Búho). Edison continuará ofreciendo uso de nivel gratuito para usuarios ocasionales y académicos, al tiempo que ofrecerá límites de velocidad más altos y funciones adicionales para los usuarios que las necesiten. Puede leer más sobre este spin-out en nuestro blog, a continuación.
Algunas notas importantes si vas a probar Kosmos. En primer lugar, Kosmos es diferente de muchas otras herramientas de IA con las que podrías haber jugado, incluidos nuestros otros agentes. Es más similar a una herramienta de investigación profunda que a un chatbot: lleva algún tiempo descubrir cómo impulsarlo de manera efectiva, y hemos tratado de incluir pautas sobre esto para ayudar (ver más abajo). Cuesta $ 200 / carrera en este momento (200 créditos por ejecución y $ 1 / crédito), con algo de uso de nivel gratuito para académicos. Esto está muy descontado; las personas que se inscriban en Founding Subscriptions ahora pueden fijar el precio de $ 1 / crédito indefinidamente, pero el precio en última instancia probablemente será más alto. Una vez más, esto es menos chatbot y más herramienta de investigación, algo que se ejecuta en objetivos de alto valor según sea necesario.
También se justifican algunas advertencias. En primer lugar, encontramos que el 80% de los hallazgos de Kosmos son reproducibles, lo que también significa que el 20% no lo son, algunas cosas que dice que estarán mal. Además, Kosmos ciertamente produce resultados que son equivalentes a varios meses de trabajo humano, pero también a menudo se adentra en madrigueras de conejo o persigue hallazgos estadísticamente significativos pero científicamente irrelevantes. A menudo ejecutamos Kosmos varias veces con el mismo objetivo para probar las diversas vías de investigación que puede tomar. Todavía hay un montón de asperezas en la interfaz de usuario y demás, en las que estamos trabajando. Finalmente, somos conscientes de que la cifra de 6 meses es mucho mayor que las estimaciones de otros laboratorios de IA, como METR, sobre la duración de las tareas que los agentes de IA pueden realizar actualmente. Puede leer la discusión sobre esto en nuestra publicación de blog.
Enormes felicitaciones a nuestro equipo que armó esto, dirigido por @ludomitch y @michaelathinks: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Un agradecimiento particular a @m_skarlinski y su equipo que reconstruyeron la plataforma para este lanzamiento, especialmente Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 y más.
Este trabajo no habría sido posible sin las contribuciones significativas de los colaboradores académicos @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani y @RandallBateman3.
También queremos agradecer a nuestros numerosos seguidores, especialmente a @ericschmidt, quien ha sido un tremendo aliado. ¡Pronto tendremos más que decir sobre nuestros seguidores!
Populares
Ranking
Favoritas

