Atari 2600 колись був золотим еталоном для AI-агентів під час моєї аспірантури. Одна нейронна мережа, здатна запускати 50+ ігор Atari, вважалася б неймовірною. Моделі мали труднощі з відтворенням 84x84 піксельного екрану в відтінках сірого на кілька кнопок. Потім OpenAI Five (Dota) та AlphaStar від DeepMind підняли рівень гри, перемігши провідних чемпіонів світу в кіберспорті. Проте вони переповнюються в одному віртуальному просторі одночасно. Будь-яка зміна могла б миттєво зламати модель. Люди надзвичайно добре пристосовуються до зовсім іншої фізики та правил — чого досі вислизають від наших найрозвинутіших трильйонних LLM. Уявіть 1000 ігор як 1000 симуляцій. Чим більше віртуальних світів агент може адаптуватися, тим краще він розвиває втілене мислення, сприйняття та моторну координацію. Усі важливі частини великої головоломки для робототехніки. Відкриваючи модель NitroGen і Gym API, ми досягаємо тієї ж мети, що й AlphaGo, AlphaStar, OpenAI Five і нещодавно Google SIMA: не забирати задоволення від цих ігор, а підкреслювати обмеження сучасного ШІ, надати міцну базу та створити новий бенчмарк — «Atari 2.0» — для відповідного вимірювання прогресу.