🚀 Introductie van SARM: Fase-bewuste Beloningsmodellering voor Lange-Horizon Robotmanipulatie Robots hebben moeite met taken zoals het vouwen van een gekreukt T-shirt—lang, contactrijk en moeilijk te labelen. We stellen een schaalbaar beloningsmodellingsframework voor om dat op te lossen. 1/n