🚀 Einführung von SARM: Stufenbewusste Belohnungsmodellierung für langfristige Robotermanipulation Roboter haben Schwierigkeiten mit Aufgaben wie dem Falten eines zerknitterten T-Shirts – lang, kontaktreich und schwer zu kennzeichnen. Wir schlagen ein skalierbares Belohnungsmodellierungsframework vor, um das zu beheben. 1/n