Tarvitsemme syväetsimäisen hetken VLM:ille. Samoin kuin GRPO teki RL:stä normaalin ja voimakkaan, tarvitsemme saman modaliittien yhdistämiseen Kyllä, Qwen-VL:t ovat todella hyviä, mutta tuntuu kuin olisimme vain kömpelöitä. Mikrosuunnittelun innovaatiot. Todennäköisesti vain @vikhyatk osaa vihjeen.