Nous avons besoin d'un moment deepseek pour les VLM. Tout comme GRPO a rendu le RL normal et puissant, nous avons besoin de la même chose pour unifier les modalités. Oui, les Qwen-VLs sont très bons mais on dirait que nous ne faisons que tâtonner. Innovations de micro-design. Seul @vikhyatk a une idée, probablement.