nous avons récemment essayé de peaufiner un VLA pour effectuer une tâche simple, et il a obtenu de moins bons résultats qu'un modèle ACT de 10 millions de paramètres entraîné depuis zéro il manque quelque chose dans la recette. nous essayons de comprendre ce que c'est. c'est pourquoi nous n'avons pas encore lancé moonvla. ignorez le battage médiatique