另一個強化學習團隊複製了我們的物理Atari工作,並將我的基準代理與幾種標準算法進行了比較。