di recente abbiamo provato a fare il fine-tuning di un VLA per eseguire un compito semplice, e ha performato peggio di un modello ACT da 10M parametri addestrato da zero c'è qualcosa che manca nella ricetta. stiamo cercando di capire cos'è. ecco perché non abbiamo ancora lanciato moonvla. ignora l'hype