Uma continuação legal do nosso trabalho físico com Atari. Pessoas que só usaram RL em ambientes simulados rápidos e simples subestimam enormemente a complexidade do mundo real; Eles acabam desenvolvendo objetivos de pesquisa que não podem ser alcançados em ambientes complexos (por exemplo, generalização zero-shot, aprendizado de modelos causais). O Atari físico ainda é um ambiente extremamente simples e, ainda assim, é suficiente para destacar as limitações dos métodos desenvolvidos para aprender com simulações rápidas. Humanos e animais aprendem em ambientes que são ordens de magnitude mais complexos do que o Atari físico. Desenvolver algoritmos que possam fazer o mesmo deveria ser o objetivo se quisermos inteligência abundante.