🚀 Présentation de SARM : Modélisation de Récompense Sensible au Stade pour la Manipulation Robotique à Long Terme Les robots ont du mal avec des tâches comme plier un T-shirt froissé : longues, riches en contacts et difficiles à étiqueter. Nous proposons un cadre de modélisation de récompense évolutif pour remédier à cela. 1/n