Bugün, en yeni Yapay Zeka Bilim Adamımız Kosmos'un kullanıma hazır olduğunu duyuruyoruz. Kullanıcılar, Kosmos'un tek bir günde 6 aylık iş yaptığını tahmin ediyor. Bir çalıştırma 1.500 makale okuyabilir ve 42.000 satır kod yazabilir. Bulgularının en az %79'u tekrarlanabilir. Kosmos, akademik beta testçilerimizle işbirliği içinde nörobilimden malzeme bilimine ve klinik genetiğe kadar çeşitli alanlarda bugüne kadar yayınladığımız 7 keşfe imza attı. Bu keşiflerden üçü yayınlanmamış bulguları yeniden üretti; dördü bilimsel literatüre net yeni, doğrulanmış katkılardır. Yapay zeka ile hızlandırılmış bilim burada. Kosmos'taki temel yeniliğimiz, yapılandırılmış, sürekli güncellenen bir dünya modelinin kullanılmasıdır. Teknik raporumuzda açıklandığı gibi, Kosmos'un dünya modeli, en uzun bağlamlı dil modellerinin bağlamına bile sığabilecek büyüklük sıralarında daha fazla bilgiyi işlemesine izin vererek, Robin'den veya diğer önceki aracılarımızdan daha uzun zaman dilimlerinde daha fazla bilgi sentezlemesine ve tutarlı hedefler izlemesine olanak tanır. Bu bağlamda, Kosmos'un herhangi bir alanda şimdiye kadar piyasaya sürülen en yoğun bilgi işlem gerektiren dil aracısı ve bugün mevcut olan açık ara en yetenekli Yapay Zeka Bilimcisi olduğuna inanıyoruz. Kalıcı bir dünya modelinin kullanılması, tek Kosmos yörüngelerinin birden fazla önemli mantıksal sıçrama gerektiren oldukça karmaşık çıktılar üretmesini de sağlar. Tüm sistemlerimizde olduğu gibi, Kosmos da şeffaflık ve doğrulanabilirlik göz önünde bulundurularak tasarlanmıştır: Bir Kosmos raporundaki her sonuç, platformumuz aracılığıyla belirli kod satırlarına veya ona ilham veren bilimsel literatürdeki belirli pasajlara kadar izlenebilir ve Kosmos'un bulgularının her zaman tam olarak denetlenebilir olmasını sağlar. Bu fırsatı, FutureHouse'un yeni bir ticari yan kuruluşu olan ve ajanlarımızı ticarileştirmeye ve bunları ilaç keşfi ve ötesindeki bilimsel araştırmaları otomatikleştirmek için uygulamaya odaklanacak olan Edison Scientific'in lansmanını duyurmak için de kullanıyoruz. Edison, Literature, Molecules ve Precedent aracılarımızın (önceden Crow, Phoenix ve Owl) yanı sıra Kosmos'a erişebileceğiniz FutureHouse platformunun yönetimini devralacak. Edison, sıradan kullanıcılar ve akademisyenler için ücretsiz katman kullanımı sunmaya devam ederken, aynı zamanda ihtiyaç duyan kullanıcılar için daha yüksek oran limitleri ve ek özellikler sunacak. Bu bölünme hakkında daha fazla bilgiyi aşağıdaki blogumuzda okuyabilirsiniz. Kosmos'u deneyecekseniz birkaç önemli not. İlk olarak, Kosmos, diğer aracılarımız da dahil olmak üzere oynamış olabileceğiniz diğer birçok yapay zeka aracından farklıdır. Bir sohbet robotundan çok bir Derin Araştırma aracına benzer: etkili bir şekilde nasıl yönlendirileceğini bulmak biraz zaman alır ve yardımcı olması için bununla ilgili yönergeler eklemeye çalıştık (aşağıya bakın). Şu anda çalıştırma başına 200 ABD Doları (çalıştırma başına 200 kredi ve 1 ABD Doları/kredi) maliyeti vardır ve akademisyenler için bazı ücretsiz katman kullanımları vardır. Bu büyük ölçüde indirimlidir; Kurucu Aboneliklere şimdi kaydolan kişiler, kredi başına 1 ABD doları fiyatını süresiz olarak kilitleyebilirler, ancak sonuçta fiyat muhtemelen daha yüksek olacaktır. Yine, bu daha az sohbet robotu ve daha fazla araştırma aracıdır, gerektiğinde yüksek değerli hedefler üzerinde çalıştırdığınız bir şeydir. Bazı uyarılar da garanti edilir. İlk olarak, Kosmos bulgularının %80'inin tekrarlanabilir olduğunu bulduk, bu da %20'sinin tekrarlanamayacağı anlamına geliyor -- söylediği bazı şeyler yanlış olacak. Ayrıca, Kosmos kesinlikle birkaç aylık insan emeğine eşdeğer çıktılar üretir, ancak aynı zamanda sıklıkla tavşan deliklerinden aşağı iner veya istatistiksel olarak anlamlı ancak bilimsel olarak alakasız bulguların peşine düşer. Kosmos'un alabileceği çeşitli araştırma yollarını örneklemek için genellikle aynı amaç üzerinde birden çok kez çalıştırıyoruz. Kullanıcı arayüzünde ve üzerinde çalıştığımız bir sürü pürüzlü kenar var. Son olarak, 6 aylık rakamın, METR gibi diğer yapay zeka laboratuvarlarının Yapay Zeka Aracılarının şu anda gerçekleştirebileceği görevlerin uzunluğuna ilişkin tahminlerinden çok daha yüksek olduğunun farkındayız. Bununla ilgili tartışmayı blog yazımızda okuyabilirsiniz. Bunu bir araya getiren, @ludomitch ve @michaelathinks liderliğindeki ekibimizi çok tebrik ederiz: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Bu lansman için platformu yeniden inşa eden @m_skarlinski ve ekibine, özellikle Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 ve daha fazlasına özel bir teşekkür. Bu çalışma, @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani ve @RandallBateman3 akademik işbirlikçilerinin önemli katkıları olmasaydı mümkün olamazdı. Ayrıca çok sayıda destekçimize, özellikle de muazzam bir müttefik olan @ericschmidt'e teşekkür etmek istiyoruz. Yakında destekçilerimiz hakkında söyleyecek daha çok şeyimiz olacak!