Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vandaag kondigen we Kosmos aan, onze nieuwste AI-wetenschapper, die nu beschikbaar is om te gebruiken.
Gebruikers schatten dat Kosmos 6 maanden werk in één enkele dag doet. Eén run kan 1.500 papers lezen en 42.000 regels code schrijven. Ten minste 79% van zijn bevindingen zijn reproduceerbaar. Kosmos heeft tot nu toe 7 ontdekkingen gedaan, die we vandaag vrijgeven, op gebieden variërend van neurowetenschappen tot materiaalkunde en klinische genetica, in samenwerking met onze academische bètatesters. Drie van deze ontdekkingen reproduceerden ongepubliceerde bevindingen; vier zijn nieuwe, gevalideerde bijdragen aan de wetenschappelijke literatuur. AI-versnelde wetenschap is hier.
Onze kerninnovatie in Kosmos is het gebruik van een gestructureerd, continu bijgewerkt wereldmodel. Zoals beschreven in ons technische rapport, stelt het wereldmodel van Kosmos het in staat om orders of magnitude meer informatie te verwerken dan in de context van zelfs de langste-taalmodellen past, waardoor het meer informatie kan synthetiseren en coherente doelen kan nastreven over langere tijdshorizonten dan Robin of een van onze andere eerdere agenten. In dit opzicht geloven we dat Kosmos de meest rekenintensieve taalagent is die tot nu toe in enig veld is vrijgegeven, en verreweg de meest capabele AI-wetenschapper die vandaag beschikbaar is. Het gebruik van een persistent wereldmodel stelt ook enkele Kosmos-trajecten in staat om zeer complexe outputs te produceren die meerdere significante logische sprongen vereisen. Zoals bij al onze systemen is Kosmos ontworpen met transparantie en verifieerbaarheid in gedachten: elke conclusie in een Kosmos-rapport kan via ons platform worden herleid tot de specifieke regels code of de specifieke passages in de wetenschappelijke literatuur die het inspireerden, waardoor wordt gegarandeerd dat de bevindingen van Kosmos te allen tijde volledig controleerbaar zijn.
We maken ook van deze gelegenheid gebruik om de lancering van Edison Scientific aan te kondigen, een nieuwe commerciële spin-off van FutureHouse, die zich zal richten op het commercialiseren van onze agenten en het toepassen ervan om wetenschappelijk onderzoek in geneesmiddelenonderzoek en daarbuiten te automatiseren. Edison zal het beheer van het FutureHouse-platform overnemen, waar je toegang kunt krijgen tot Kosmos naast onze Literatuur-, Moleculen- en Precedent-agenten (voorheen Crow, Phoenix en Owl). Edison zal gratis gebruik voor casual gebruikers en academici blijven aanbieden, terwijl ook hogere limieten en extra functies worden aangeboden voor gebruikers die deze nodig hebben. Je kunt meer lezen over deze spin-off op onze blog, hieronder.
Een paar belangrijke opmerkingen als je Kosmos gaat proberen. Ten eerste, Kosmos is anders dan veel andere AI-tools waarmee je misschien hebt gespeeld, inclusief onze andere agenten. Het is meer vergelijkbaar met een Deep Research-tool dan met een chatbot: het kost enige tijd om uit te vinden hoe je het effectief kunt aansteken, en we hebben geprobeerd richtlijnen hiervoor op te nemen om te helpen (zie hieronder). Het kost momenteel $200/run (200 credits per run, en $1/credit), met wat gratis gebruik voor academici. Dit is sterk afgeprijsd; mensen die zich nu inschrijven voor Founding Subscriptions kunnen de $1/credit-prijs voor onbepaalde tijd vastzetten, maar de prijs zal uiteindelijk waarschijnlijk hoger zijn. Nogmaals, dit is minder een chatbot en meer een onderzoekstool, iets dat je op hoogwaardig doelwit draait indien nodig.
Er zijn ook enkele kanttekeningen te maken. Ten eerste, we merken dat 80% van de bevindingen van Kosmos reproduceerbaar zijn, wat ook betekent dat 20% dat niet zijn - sommige dingen die het zegt zullen verkeerd zijn. Ook produceert Kosmos zeker outputs die gelijkwaardig zijn aan meerdere maanden menselijk werk, maar het gaat ook vaak de verkeerde kant op of jaagt statistisch significante maar wetenschappelijk irrelevante bevindingen na. We draaien Kosmos vaak meerdere keren op hetzelfde doel om de verschillende onderzoekspaden die het kan nemen te verkennen. Er zijn nog steeds een aantal ruwe randen op de UI en dergelijke, waar we aan werken. Ten slotte zijn we ons ervan bewust dat de 6 maanden figuur veel groter is dan schattingen van andere AI-laboratoria, zoals METR, over de lengte van taken die AI-agenten momenteel kunnen uitvoeren. Je kunt hierover discussie lezen in onze blogpost.
Grote felicitaties aan ons team dat dit heeft samengesteld, geleid door @ludomitch en @michaelathinks: Angela Yiu, @benjamin0chang, @sidn137, Edwin Melville-Green, Albert Bou, @arvissulovari, Oz Wassie, @jonmlaurent. Een bijzondere shout-out naar @m_skarlinski en zijn team dat het platform voor deze lancering heeft herbouwd, vooral Andy Cai @notAndyCai, Richard Magness, Remo Storni, Tyler Nadolski @_tnadolski, Mayk Caldas @maykcaldas, Sam Cox @samcox822 en meer.
Dit werk zou niet mogelijk zijn geweest zonder significante bijdragen van academische samenwerkingspartners @mathieubourdenx, @EricLandsness, @bdanubius, @physicistnevans, Tonio Buonassisi, @BGomes_1905, Shriya Reddy, @marthafoiani, en @RandallBateman3.
We willen ook onze talrijke supporters bedanken, vooral @ericschmidt, die een geweldige bondgenoot is geweest. We zullen binnenkort meer te zeggen hebben over onze supporters!
Boven
Positie
Favorieten

