Tänään julkistamme Kosmoksen, uusimman tekoälytutkijamme, joka on nyt käytettävissä. Käyttäjät arvioivat, että Kosmos tekee 6 kuukautta työtä yhdessä päivässä. Yhdellä ajokerralla voi lukea 1 500 artikkelia ja kirjoittaa 42 000 riviä koodia. Vähintään 79 % sen löydöksistä on toistettavissa. Kosmos on tehnyt tähän mennessä 7 löytöä, jotka julkaisemme tänään neurotieteestä materiaalitieteeseen ja kliiniseen genetiikkaan yhteistyössä akateemisten beta-testaajiemme kanssa. Kolme näistä löydöistä toisti julkaisemattomia havaintoja; neljä on netto uusia, validoituja panoksia tieteelliseen kirjallisuuteen. Tekoälyn kiihdytetty tiede on täällä. Ydininnovaatiomme Kosmoksessa on jäsennellyn, jatkuvasti päivitettävän maailmanmallin käyttö. Kuten teknisessä raportissamme kuvataan, Kosmoksen maailmanmalli sallii sen käsitellä suuruusluokkaa enemmän tietoa kuin mahtuisi jopa pisimmän kontekstin kielimallien kontekstiin, jolloin se voi syntetisoida enemmän tietoa ja pyrkiä johdonmukaisiin tavoitteisiin pidemmällä aikavälillä kuin Robin tai kukaan muu aikaisempi agenttimme. Tässä suhteessa uskomme, että Kosmos on tähän mennessä julkaistuin laskentaintensiivisin kieliagentti millään alalla ja ylivoimaisesti kyvykkäin saatavilla oleva tekoälytutkija. Pysyvän maailmanmallin käyttö mahdollistaa myös sen, että yksittäiset Kosmos-liikeradat tuottavat erittäin monimutkaisia tuloksia, jotka vaativat useita merkittäviä loogisia hyppyjä. Kuten kaikki järjestelmämme, Kosmos on suunniteltu läpinäkyvyyttä ja todennettavuutta ajatellen: jokainen Kosmos-raportin johtopäätös voidaan jäljittää alustamme kautta tiettyihin koodiriveihin tai tieteellisen kirjallisuuden tiettyihin kohtiin, jotka inspiroivat sitä, mikä varmistaa, että Kosmos-raportin havainnot ovat aina täysin tarkastettavissa. Käytämme tätä tilaisuutta myös ilmoittaaksemme Edison Scientificin, FutureHousen uuden kaupallisen spinoutin, lanseerauksesta, joka keskittyy agenttiemme kaupallistamiseen ja niiden soveltamiseen tieteellisen tutkimuksen automatisointiin lääkekehityksessä ja sen ulkopuolella. Edison ottaa haltuunsa FutureHouse-alustan hallinnan, jossa voit käyttää Kosmos-ohjelmaa kirjallisuuden, molekyylien ja ennakkotapausten agenttien (aiemmin Crow, Phoenix ja Owl) rinnalla. Edison tarjoaa jatkossakin ilmaisen tason käyttöä satunnaisille käyttäjille ja tutkijoille ja tarjoaa samalla korkeampia nopeusrajoja ja lisäominaisuuksia niitä tarvitseville käyttäjille. Voit lukea lisää tästä spinoutista blogistamme alta. Muutama tärkeä huomautus, jos aiot kokeilla Kosmosta. Ensinnäkin Kosmos eroaa monista muista tekoälytyökaluista, joilla olet ehkä leikkinyt, mukaan lukien muut agenttimme. Se muistuttaa enemmän Deep Research -työkalua kuin chatbotia: kestää jonkin aikaa selvittää, miten sitä kehotetaan tehokkaasti, ja olemme yrittäneet sisällyttää tähän ohjeita avuksi (katso alla). Se maksaa tällä hetkellä 200 dollaria/juoksu (200 krediittiä per ajo ja 1 dollari/krediitti), ja tutkijoille on jonkin verran ilmaista tasoa. Tämä on voimakkaasti alennettu; ihmiset, jotka rekisteröityvät Founding Subscriptionsiin nyt, voivat lukita 1 dollarin luottohinnan loputtomiin, mutta hinta on lopulta todennäköisesti korkeampi. Tämä on jälleen vähemmän chatbot ja enemmän tutkimustyökalu, jota käytät arvokkaissa kohteissa tarpeen mukaan. Jotkut varoitukset ovat myös perusteltuja. Ensinnäkin huomaamme, että 80 % Kosmoksen löydöksistä on toistettavissa, mikä tarkoittaa myös sitä, että 20 % ei ole -- jotkut asiat, jotka siinä sanotaan, ovat vääriä. Lisäksi Kosmos tuottaa varmasti tuotoksia, jotka vastaavat useiden kuukausien ihmistyötä, mutta se myös usein menee kaninkoloihin tai jahtaa tilastollisesti merkittäviä mutta tieteellisesti epäolennaisia havaintoja. Järjestämme Kosmoksen usein useita kertoja samasta tavoitteesta saadaksemme näytteitä sen eri tutkimustavoista. Käyttöliittymässä ja vastaavissa on edelleen joukko karkeita reunoja, joiden parissa työskentelemme. Lopuksi olemme tietoisia siitä, että 6 kuukauden luku on paljon suurempi kuin muiden tekoälylaboratorioiden, kuten METR:n, arviot tehtävien pituudesta, joita tekoälyagentit voivat tällä hetkellä suorittaa. Voit lukea keskustelua tästä blogikirjoituksestamme. Suuret onnittelut tiimillemme, joka kokosi tämän, jota johtivat @ludomitch ja @michaelathinks: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie @jonmlaurent. Erityinen kiitos @m_skarlinski ja hänen tiimilleen, jotka rakensivat alustan uudelleen tätä julkaisua varten, erityisesti Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 ja monet muut. Tämä työ ei olisi ollut mahdollista ilman akateemisten yhteistyökumppaneiden @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisin, @BGomes_1905, Shriya Reddyn, @marthafoiani ja @RandallBateman3:n merkittävää panosta. Haluamme myös kiittää lukuisia tukijoitamme, erityisesti @ericschmidt, joka on ollut valtava liittolainen. Meillä on pian lisää sanottavaa tukijoistamme!