Tindak lanjut yang keren untuk pekerjaan Atari Fisik kami. Orang yang hanya menggunakan RL dengan lingkungan simulasi yang cepat dan sederhana sangat meremehkan kompleksitas dunia nyata; mereka akhirnya mengembangkan tujuan penelitian yang tidak dapat dicapai di lingkungan yang kompleks (misalnya, generalisasi zero-shot, mempelajari model kausal). Atari fisik masih merupakan lingkungan yang sangat sederhana namun cukup untuk menyoroti keterbatasan metode yang dikembangkan untuk belajar dengan simulasi cepat. Manusia dan hewan belajar di lingkungan yang ordo besarnya lebih kompleks daripada Atari Fisik. Mengembangkan algoritma yang dapat melakukan hal yang sama harus menjadi tujuan jika kita menginginkan kecerdasan yang melimpah.