We hebben een deepseek-moment nodig voor VLM's. Net zoals GRPO RL normaal en krachtig maakte, hebben we hetzelfde nodig voor het verenigen van modaliteiten. Ja, Qwen-VLs zijn heel goed, maar het lijkt alsof we gewoon aan het rommelen zijn. Micro-ontwerpinnovaties. Alleen @vikhyatk heeft een idee, waarschijnlijk.