Un seguimiento genial de nuestro trabajo físico en Atari. Las personas que solo han usado el RL con entornos simulados rápidos y sencillos subestiman enormemente la complejidad del mundo real; Acaban desarrollando objetivos de investigación que no pueden alcanzarse en entornos complejos (por ejemplo, generalización sin disparos, aprendizaje de modelos causales). El Atari físico sigue siendo un entorno extremadamente sencillo y, sin embargo, basta con destacar las limitaciones de los métodos desarrollados para aprender con simulaciones rápidas. Los humanos y los animales aprenden en entornos que son órdenes de magnitud más complejos que los Atari físicos. Desarrollar algoritmos que puedan hacer lo mismo debería ser el objetivo si queremos una inteligencia abundante.