Dziś ogłaszamy Kosmos, naszego najnowszego AI Scientist, dostępnego do użycia już teraz. Użytkownicy szacują, że Kosmos wykonuje 6 miesięcy pracy w jeden dzień. Jedno uruchomienie może przeczytać 1 500 prac i napisać 42 000 linii kodu. Co najmniej 79% jego odkryć jest powtarzalnych. Kosmos dokonał dotychczas 7 odkryć, które dziś publikujemy, w obszarach od neurobiologii po nauki materiałowe i genetykę kliniczną, we współpracy z naszymi akademickimi beta testerami. Trzy z tych odkryć powtórzyły niepublikowane wyniki; cztery to nowe, zweryfikowane wkłady do literatury naukowej. Nauka przyspieszona przez AI jest już tutaj. Naszą kluczową innowacją w Kosmosie jest wykorzystanie strukturalnego, ciągle aktualizowanego modelu świata. Jak opisano w naszym raporcie technicznym, model świata Kosmosu pozwala mu przetwarzać rzędy wielkości więcej informacji, niż mogłoby pomieścić nawet najdłuższe modele językowe, co pozwala mu syntetyzować więcej informacji i dążyć do spójnych celów na dłuższe horyzonty czasowe niż Robin czy jakiekolwiek z naszych wcześniejszych agentów. W tym względzie uważamy, że Kosmos jest najbardziej intensywnym obliczeniowo agentem językowym, który został dotychczas wydany w jakiejkolwiek dziedzinie, i zdecydowanie najbardziej zdolnym AI Scientist dostępnym dzisiaj. Użycie trwałego modelu świata umożliwia również pojedynczym trajektoriom Kosmosu generowanie wysoce złożonych wyników, które wymagają wielu istotnych skoków logicznych. Jak w przypadku wszystkich naszych systemów, Kosmos został zaprojektowany z myślą o przejrzystości i weryfikowalności: każdy wniosek w raporcie Kosmosu można prześledzić przez naszą platformę do konkretnych linii kodu lub konkretnych fragmentów w literaturze naukowej, które go zainspirowały, zapewniając, że odkrycia Kosmosu są w pełni audytowalne w każdym momencie. Wykorzystujemy również tę okazję, aby ogłosić uruchomienie Edison Scientific, nowego komercyjnego spinoutu FutureHouse, który będzie skoncentrowany na komercjalizacji naszych agentów i ich zastosowaniu do automatyzacji badań naukowych w odkrywaniu leków i nie tylko. Edison przejmie zarządzanie platformą FutureHouse, gdzie można uzyskać dostęp do Kosmosu obok naszych agentów Literature, Molecules i Precedent (wcześniej Crow, Phoenix i Owl). Edison nadal będzie oferować bezpłatne korzystanie z poziomu podstawowego dla użytkowników okazjonalnych i akademickich, a także wyższe limity i dodatkowe funkcje dla użytkowników, którzy ich potrzebują. Możesz przeczytać więcej o tym spinoucie na naszym blogu, poniżej. Kilka ważnych uwag, jeśli zamierzasz wypróbować Kosmos. Po pierwsze, Kosmos różni się od wielu innych narzędzi AI, z którymi mogłeś się bawić, w tym naszych innych agentów. Jest bardziej podobny do narzędzia Deep Research niż do chatbota: zajmuje trochę czasu, aby dowiedzieć się, jak skutecznie go wywołać, i staraliśmy się zawrzeć wytyczne w tym celu (patrz poniżej). Kosztuje obecnie 200 USD/uruchomienie (200 kredytów za uruchomienie i 1 USD/kredyt), z pewnym bezpłatnym korzystaniem dla akademików. To jest mocno zniżone; osoby, które zapiszą się na Founding Subscriptions teraz, mogą zablokować cenę 1 USD/kredyt na czas nieokreślony, ale ostateczna cena prawdopodobnie będzie wyższa. Jeszcze raz, to mniej chatbot, a bardziej narzędzie badawcze, coś, co uruchamiasz na cennych celach w razie potrzeby. Należy również zwrócić uwagę na pewne zastrzeżenia. Po pierwsze, stwierdzamy, że 80% odkryć Kosmosu jest powtarzalnych, co oznacza również, że 20% nie jest - niektóre rzeczy, które mówi, będą błędne. Kosmos z pewnością produkuje wyniki, które odpowiadają kilku miesiącom pracy ludzkiej, ale często również schodzi na manowce lub goni statystycznie istotne, ale naukowo nieistotne wyniki. Często uruchamiamy Kosmos wiele razy na tym samym celu, aby spróbować różnych dróg badawczych, które może podjąć. Wciąż jest wiele niedoskonałości w interfejsie użytkownika i tym podobnych, nad którymi pracujemy. Wreszcie, jesteśmy świadomi, że figura 6 miesięcy jest znacznie większa niż szacunki innych laboratoriów AI, takich jak METR, dotyczące długości zadań, które agenci AI mogą obecnie wykonywać. Możesz przeczytać dyskusję na ten temat w naszym poście na blogu. Ogromne gratulacje dla naszego zespołu, który to zrealizował, kierowanego przez @ludomitch i @michaelathinks: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Szczególne podziękowania dla @m_skarlinski i jego zespołu, który odbudował platformę na tę premierę, w szczególności Andy'emu Cai @notAndyCai, Richardowi Magnessowi, Remo Storni, Tylerowi Nadolskiemu @_tnadolski, Maykowi Caldasowi @maykcaldas, Samowi Coxowi @samcox822 i innym. Ta praca nie byłaby możliwa bez znaczących wkładów od akademickich współpracowników @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani i @RandallBateman3. Chcemy również podziękować naszym licznym zwolennikom, szczególnie @ericschmidt, który był ogromnym sojusznikiem. Wkrótce będziemy mieli więcej do powiedzenia o naszych zwolennikach!