🚀 Vi presenterar SARM: Scenmedveten belöningsmodellering för robotmanipulation med långa horisonter Robotar kämpar med uppgifter som att vika en skrynklig t-shirt – lång, kontaktrik och svår att märka. Vi föreslår ett skalbart ramverk för belöningsmodellering för att åtgärda det. 1/n