我們最近嘗試對 VLA 進行微調以執行一個簡單的任務,但它的表現比從零開始訓練的 10M 參數 ACT 模型還要差。 這個配方中缺少了什麼。我們正在試圖找出是什麼。這就是為什麼我們還沒有推出 moonvla。忽略那些炒作。