Astăzi, anunțăm Kosmos, cel mai nou om de știință AI, disponibil pentru utilizare acum. Utilizatorii estimează că Kosmos face 6 luni de muncă într-o singură zi. O rulare poate citi 1.500 de lucrări și poate scrie 42.000 de linii de cod. Cel puțin 79% dintre constatările sale sunt reproductibile. Kosmos a făcut 7 descoperiri până acum, pe care le lansăm astăzi, în domenii variind de la neuroștiință la știința materialelor și genetică clinică, în colaborare cu testerii noștri beta academici. Trei dintre aceste descoperiri au reprodus descoperiri nepublicate; patru sunt contribuții noi și validate la literatura științifică. Știința accelerată de inteligență artificială este aici. Inovația noastră de bază în Kosmos este utilizarea unui model mondial structurat, actualizat continuu. După cum este descris în raportul nostru tehnic, modelul mondial al Kosmos îi permite să proceseze ordine de mărime mai multe informații decât s-ar putea încadra chiar și în contextul modelelor de limbaj cu cel mai lung context, permițându-i să sintetizeze mai multe informații și să urmărească obiective coerente pe orizonturi de timp mai lungi decât Robin sau oricare dintre ceilalți agenți ai noștri anteriori. În acest sens, credem că Kosmos este cel mai intensiv agent de limbaj lansat până acum în orice domeniu și de departe cel mai capabil om de știință AI disponibil astăzi. Utilizarea unui model de lume persistent permite, de asemenea, traiectoriilor Kosmos unice să producă rezultate extrem de complexe care necesită mai multe salturi logice semnificative. Ca și în cazul tuturor sistemelor noastre, Kosmos este conceput având în vedere transparența și verificabilitatea: fiecare concluzie dintr-un raport Kosmos poate fi urmărită prin intermediul platformei noastre până la liniile de cod specifice sau pasajele specifice din literatura științifică care l-au inspirat, asigurându-se că descoperirile Kosmos sunt pe deplin auditabile în orice moment. De asemenea, folosim această oportunitate pentru a anunța lansarea Edison Scientific, un nou spin-out comercial al FutureHouse, care se va concentra pe comercializarea agenților noștri și aplicarea lor pentru a automatiza cercetarea științifică în descoperirea de medicamente și nu numai. Edison va prelua managementul platformei FutureHouse, unde puteți accesa Kosmos alături de agenții noștri de literatură, molecule și precedent (anterior Crow, Phoenix și Owl). Edison va continua să ofere utilizare gratuită pentru utilizatorii ocazionali și academicieni, oferind în același timp limite de tarif mai mari și funcții suplimentare pentru utilizatorii care au nevoie de ele. Puteți citi mai multe despre acest spinout pe blogul nostru, mai jos. Câteva note importante dacă aveți de gând să încercați Kosmos. În primul rând, Kosmos este diferit de multe alte instrumente AI cu care ați jucat, inclusiv de ceilalți agenți ai noștri. Este mai asemănător cu un instrument de cercetare profundă decât cu un chatbot: este nevoie de ceva timp pentru a ne da seama cum să-l solicităm eficient și am încercat să includem linii directoare în acest sens pentru a ajuta (vezi mai jos). Costă 200 USD/alergare chiar acum (200 de credite pe alergare și 1 USD/credit), cu o utilizare gratuită pentru academicieni. Acest lucru este foarte redus; persoanele care se înscriu pentru abonamente fondatoare acum pot bloca prețul de 1 USD/credit pe termen nelimitat, dar prețul în cele din urmă va fi probabil mai mare. Din nou, acesta este mai puțin chatbot și mai mult instrument de cercetare, ceva ce rulați pe ținte de mare valoare, după cum este necesar. Unele avertismente sunt, de asemenea, justificate. În primul rând, descoperim că 80% din descoperirile Kosmos sunt reproductibile, ceea ce înseamnă că 20% nu sunt -- unele lucruri pe care le spune vor fi greșite. De asemenea, Kosmos produce cu siguranță rezultate care sunt echivalente cu câteva luni de muncă umană, dar adesea merge în vizuini de iepure sau urmărește descoperiri semnificative din punct de vedere statistic, dar irelevante din punct de vedere științific. De multe ori rulăm Kosmos de mai multe ori pe același obiectiv pentru a eșantiona diferitele căi de cercetare pe care le poate lua. Există încă o grămadă de margini aspre pe interfața de utilizare și altele, la care lucrăm. În cele din urmă, suntem conștienți de faptul că cifra de 6 luni este mult mai mare decât estimările altor laboratoare AI, cum ar fi METR, cu privire la durata sarcinilor pe care agenții AI le pot îndeplini în prezent. Puteți citi discuția despre acest lucru în postarea noastră de pe blog. Felicitări uriașe echipei noastre care a realizat acest lucru, condusă de @ludomitch și @michaelathinks: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Un strigăt special pentru @m_skarlinski și echipa sa care a reconstruit platforma pentru această lansare, în special Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 și mulți alții. Această muncă nu ar fi fost posibilă fără contribuții semnificative din partea colaboratorilor academici @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani și @RandallBateman3. De asemenea, dorim să le mulțumim numeroșilor noștri susținători, în special @ericschmidt, care a fost un aliat extraordinar. Vom avea mai multe de spus despre suporterii noștri în curând!