Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Atari 2600 dulunya menjadi tolok ukur emas untuk agen AI selama masa PhD saya. Jaring saraf tunggal yang mampu memainkan 50+ game Atari akan dianggap menakjubkan. Model-model berjuang untuk memetakan layar piksel skala abu-abu 84x84 ke beberapa tombol.
Kemudian OpenAI Five (Dota) dan AlphaStar dari DeepMind meningkatkan permainan, mengalahkan juara top dunia di Esports. Namun mereka terlalu cocok dengan satu lingkungan virtual pada satu waktu. Mengubah apa pun akan merusak model secara instan.
Manusia sangat pandai beradaptasi dengan fisika dan aturan yang sangat berbeda - sesuatu yang terus menghindari LLM skala triliunan kita yang paling canggih. Pikirkan 1000 game sebagai 1000 simulasi. Semakin banyak dunia virtual yang dapat diadaptasi oleh agen, semakin baik ia mengembangkan penalaran, persepsi, dan koordinasi motorik yang terwujud. Semua potongan penting dalam teka-teki besar untuk robotika.
Dengan membuka model NitroGen dan API Gym, kami melayani tujuan yang sama dengan AlphaGo, AlphaStar, OpenAI Five, dan baru-baru ini Google SIMA: bukan untuk menghilangkan kesenangan dari game-game tersebut, tetapi untuk menyoroti keterbatasan AI modern, memberikan dasar yang solid, dan membuat tolok ukur baru - "Atari 2.0" - untuk mengukur kemajuan yang sesuai.
Teratas
Peringkat
Favorit
