🚀 Giới thiệu SARM: Mô hình thưởng nhận thức giai đoạn cho việc thao tác robot dài hạn Robot gặp khó khăn với các nhiệm vụ như gấp một chiếc áo phông nhăn—dài, nhiều tiếp xúc và khó để gán nhãn. Chúng tôi đề xuất một khung mô hình thưởng có thể mở rộng để khắc phục điều đó. 1/n