Vi presenterar NitroGen, en öppen källkodsmodell tränad för att spela 1000+ spel: RPG, plattformsspel, battle royale, racing, 2D, 3D, vad som helst! Vi är på jakt efter allmänna förkroppsligade agenter som behärskar inte bara den verkliga fysiken, utan också all möjlig fysik över ett multiversum av simuleringar. Vi upptäckte att vår GR00T N1.5-arkitektur, ursprungligen designad för robotik, enkelt kan anpassas för att spela många spel med helt olika mekaniker. Vårt recept är enkelt och bittert med lektioner: (1) en 40 000+ timmars högkvalitativ datamängd av offentligt spel i det vilda; (2) en mycket kapabel grundmodell för kontinuerlig motorisk styrning; (3) ett Gym-API som omsluter vilken spelbinär som helst för att köra rollouts. Vår datakuratering är väldigt rolig: det visar sig att spelare älskar att visa upp sina färdigheter genom att lägga realtidskontroll på en videoström. Så vi tränar en segmenteringsmodell för att upptäcka och extrahera dessa gamepad-displayer och omvandla dem till expertåtgärder. Vi maskerar sedan ut det området för att förhindra att modellen utnyttjar en genväg. Under träningen lär sig en variant av GR00T N1.5 att mappa från 40 000 timmar pixlar till åtgärder via diffusionstransformatorer. NitroGen är bara början, och det är långt kvar att backa i backklättring när det gäller kapaciteten. Vi fokuserar medvetet bara på System 1-sidan: "gamerinstinkten" för snabb motorik. Vi öppnar *allt* för dig att experimentera med: förtränade modellvikter, hela handlingsdatasetet, kod och ett whitepaper med tydliga detaljer. Idag är robotik en överlagring av svåra AI-problem. Imorgon kan det bli en delmängd, en prick i det mycket större latenta utrymmet av förkroppsligad AGI. Sedan promptar du bara och "ber om" en robotkontroll. Det kan vara slutmålet (ordvits avsedd). NitroGen leds gemensamt av våra briljanta hjärnor: Loic Magne, Anas Awadalla, Guanzhi Wang. Det är ett multiinstitutionellt samarbete. Kolla in Guanzhis tekniska djupdykningstråd och repo-länkar nedan!