Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Aujourd'hui, nous annonçons Kosmos, notre nouveau Scientifique AI, disponible dès maintenant.
Les utilisateurs estiment que Kosmos effectue 6 mois de travail en une seule journée. Un seul passage peut lire 1 500 articles et écrire 42 000 lignes de code. Au moins 79 % de ses résultats sont reproductibles. Kosmos a fait 7 découvertes jusqu'à présent, que nous publions aujourd'hui, dans des domaines allant des neurosciences à la science des matériaux et à la génétique clinique, en collaboration avec nos testeurs bêta académiques. Trois de ces découvertes ont reproduit des résultats non publiés ; quatre sont des contributions nouvelles et validées à la littérature scientifique. La science accélérée par l'IA est là.
Notre innovation principale dans Kosmos est l'utilisation d'un modèle mondial structuré et continuellement mis à jour. Comme décrit dans notre rapport technique, le modèle mondial de Kosmos lui permet de traiter des ordres de grandeur d'informations supplémentaires par rapport à ce qui pourrait tenir dans le contexte même des modèles de langage à long contexte, lui permettant de synthétiser plus d'informations et de poursuivre des objectifs cohérents sur des horizons temporels plus longs que Robin ou l'un de nos autres agents précédents. À cet égard, nous croyons que Kosmos est l'agent linguistique le plus intensif en calcul jamais publié dans n'importe quel domaine, et de loin le Scientifique AI le plus capable disponible aujourd'hui. L'utilisation d'un modèle mondial persistant permet également à des trajectoires uniques de Kosmos de produire des résultats hautement complexes nécessitant plusieurs sauts logiques significatifs. Comme pour tous nos systèmes, Kosmos est conçu avec la transparence et la vérifiabilité à l'esprit : chaque conclusion dans un rapport Kosmos peut être retracée à travers notre plateforme jusqu'aux lignes de code spécifiques ou aux passages spécifiques de la littérature scientifique qui l'ont inspirée, garantissant que les résultats de Kosmos sont entièrement audités à tout moment.
Nous profitons également de cette occasion pour annoncer le lancement d'Edison Scientific, un nouveau spin-off commercial de FutureHouse, qui se concentrera sur la commercialisation de nos agents et leur application pour automatiser la recherche scientifique dans la découverte de médicaments et au-delà. Edison prendra en charge la gestion de la plateforme FutureHouse, où vous pouvez accéder à Kosmos aux côtés de nos agents Littérature, Molécules et Précédent (précédemment Crow, Phoenix et Owl). Edison continuera d'offrir un usage gratuit pour les utilisateurs occasionnels et les universitaires, tout en proposant également des limites de taux plus élevées et des fonctionnalités supplémentaires pour les utilisateurs qui en ont besoin. Vous pouvez en savoir plus sur ce spin-off sur notre blog, ci-dessous.
Quelques notes importantes si vous allez essayer Kosmos. Tout d'abord, Kosmos est différent de nombreux autres outils AI que vous avez peut-être utilisés, y compris nos autres agents. Il est plus similaire à un outil de recherche approfondie qu'à un chatbot : il faut un certain temps pour comprendre comment le solliciter efficacement, et nous avons essayé d'inclure des directives à ce sujet pour aider (voir ci-dessous). Cela coûte 200 $ par passage en ce moment (200 crédits par passage, et 1 $ par crédit), avec un certain usage gratuit pour les universitaires. C'est fortement réduit ; les personnes qui s'inscrivent pour des abonnements fondateurs maintenant peuvent verrouiller le prix de 1 $ par crédit indéfiniment, mais le prix sera probablement plus élevé à terme. Encore une fois, c'est moins un chatbot et plus un outil de recherche, quelque chose que vous exécutez sur des cibles de grande valeur selon les besoins.
Certaines mises en garde sont également justifiées. Tout d'abord, nous constatons que 80 % des résultats de Kosmos sont reproductibles, ce qui signifie également que 20 % ne le sont pas -- certaines choses qu'il dit seront fausses. De plus, Kosmos produit certainement des résultats équivalents à plusieurs mois de travail humain, mais il s'engage également souvent dans des voies sans issue ou poursuit des résultats statistiquement significatifs mais scientifiquement non pertinents. Nous exécutons souvent Kosmos plusieurs fois sur le même objectif afin d'échantillonner les différentes avenues de recherche qu'il peut emprunter. Il y a encore quelques imperfections dans l'interface utilisateur et autres, sur lesquelles nous travaillons. Enfin, nous sommes conscients que le chiffre de 6 mois est bien supérieur aux estimations d'autres laboratoires AI, comme METR, concernant la durée des tâches que les agents AI peuvent actuellement effectuer. Vous pouvez lire la discussion à ce sujet dans notre article de blog.
Un énorme bravo à notre équipe qui a mis cela en place, dirigée par @ludomitch et @michaelathinks : Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Un remerciement particulier à @m_skarlinski et son équipe qui ont reconstruit la plateforme pour ce lancement, en particulier Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 et d'autres.
Ce travail n'aurait pas été possible sans les contributions significatives de nos collaborateurs académiques @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani, et @RandallBateman3.
Nous tenons également à remercier nos nombreux soutiens, en particulier @ericschmidt, qui a été un allié formidable. Nous aurons plus à dire sur nos soutiens bientôt !
Meilleurs
Classement
Favoris

