Wir stellen NitroGen vor, ein Open-Source-Grundlagenmodell, das darauf trainiert ist, über 1000 Spiele zu spielen: RPG, Plattformspiel, Battle Royale, Rennspiel, 2D, 3D, was auch immer! Wir sind auf einer Mission, allgemeine verkörperte Agenten zu entwickeln, die nicht nur die physikalischen Gesetze der realen Welt meistern, sondern auch alle möglichen Physiken in einem Multiversum von Simulationen. Wir haben festgestellt, dass unsere GR00T N1.5-Architektur, die ursprünglich für Robotik entwickelt wurde, leicht angepasst werden kann, um viele Spiele mit völlig unterschiedlichen Mechaniken zu spielen. Unser Rezept ist einfach und bitter lehrreich: (1) ein über 40.000 Stunden umfassender, hochwertiger Datensatz von öffentlichen Gameplay-Aufnahmen; (2) ein hochleistungsfähiges Grundlagenmodell für kontinuierliche Motorsteuerung; (3) eine Gym-API, die jede Spiel-Binärdatei umschließt, um Rollouts auszuführen. Unsere Datenkuratierung macht viel Spaß: Es stellt sich heraus, dass Gamer gerne ihre Fähigkeiten zeigen, indem sie die Echtzeit-Spielsteuerung auf einen Video-Stream überlagern. Daher trainieren wir ein Segmentierungsmodell, um diese Gamepad-Anzeigen zu erkennen und in Expertenaktionen umzuwandeln. Wir maskieren dann diesen Bereich, um zu verhindern, dass das Modell eine Abkürzung ausnutzt. Während des Trainings lernt eine Variante von GR00T N1.5, von 40.000 Stunden Pixeln zu Aktionen durch Diffusions-Transformatoren zuzuordnen. NitroGen ist erst der Anfang, und es gibt einen langen Weg, um die Fähigkeiten zu steigern. Wir konzentrieren uns absichtlich nur auf die System-1-Seite: den "Gamer-Instinkt" der schnellen Motorsteuerung. Wir stellen *alles* als Open Source zur Verfügung, damit Sie experimentieren können: vortrainierte Modellgewichte, den gesamten Aktionsdatensatz, Code und ein Whitepaper mit soliden Details. Heute ist Robotik eine Obermenge harter KI-Probleme. Morgen könnte es eine Teilmenge werden, ein Punkt im viel größeren latenten Raum der verkörperten AGI. Dann fordern Sie einfach einen Roboter-Controller an. Das könnte das Endspiel sein (Wortspiel beabsichtigt). NitroGen wird von unseren brillanten Köpfen geleitet: Loic Magne, Anas Awadalla, Guanzhi Wang. Es ist eine multi-institutionelle Zusammenarbeit. Schauen Sie sich Guanzhis technischen Deep-Dive-Thread und die Repo-Links unten an!