我们需要一个深度搜索的时刻来推动 VLMs。就像 GRPO 让 RL 变得正常且强大一样,我们也需要统一模态的同样效果。 是的,Qwen-VLs 非常好,但感觉我们只是在胡乱摸索。微设计创新。只有 @vikhyatk 有头绪,可能。