私たちのPhysical Atari作品のクールな続編です。 速くてシンプルなシミュレーション環境でしか強化学習を使ったことがない人は、現実世界の複雑さを大きく過小評価しています。彼らは複雑な環境では達成できない研究目標(例:ゼロショット一般化、因果モデルの学習)を形成します。 物理的なAtariはまだ非常にシンプルな環境ですが、高速シミュレーションで学習するために開発された手法の限界を浮き彫りにするのに十分です。 人間や動物は、物理的なアタリよりも桁違いに複雑な環境で学びます。豊富な知能を望むなら、同じことができるアルゴリズムの開発が目標であるべきです。