🚀 Introducendo SARM: Modello di Ricompensa Consapevole dello Stadio per la Manipolazione Robotica a Lungo Termine I robot faticano con compiti come piegare una maglietta stropicciata: lunghi, ricchi di contatti e difficili da etichettare. Proponiamo un framework di modellazione della ricompensa scalabile per risolvere questo problema. 1/n