Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Atari 2600 was vroeger de gouden standaard voor AI-agenten tijdens mijn PhD-tijd. Een enkel neuraal netwerk dat meer dan 50 Atari-spellen kon spelen, zou als verbluffend worden beschouwd. De modellen hadden moeite om een 84x84 grijswaarden pixelachtige scherm in kaart te brengen naar een paar knoppen.
Toen verhoogden OpenAI Five (Dota) en DeepMind's AlphaStar het niveau, door de beste kampioenen ter wereld in Esports te verslaan. Toch pasten ze zich aan een enkele virtuele omgeving tegelijk aan. Iets veranderen zou het model onmiddellijk breken.
Mensen zijn buitengewoon goed in het aanpassen aan heel verschillende fysica en regels - iets dat onze meest geavanceerde, triljoen-schaal LLM's blijft ontglippen. Denk aan de 1000 spellen als 1000 simulaties. Hoe meer virtuele werelden een agent zich kan aanpassen, hoe beter het zijn belichaamde redenering, perceptie en motorische coördinatie ontwikkelt. Allemaal cruciale onderdelen in de grote puzzel voor robotica.
Door het NitroGen-model en de Gym API open-source te maken, dienen we hetzelfde doel als AlphaGo, AlphaStar, OpenAI Five, en recentelijk Google SIMA: niet om het plezier van die spellen weg te nemen, maar om de beperkingen van moderne AI te benadrukken, een solide basis te bieden, en een nieuwe benchmark te creëren - "Atari 2.0" - om de voortgang dienovereenkomstig te meten.
Boven
Positie
Favorieten
