Google DeepMind опубликовала ключевую статью о визуальном интеллекте: "Видеомодели являются нулевыми обучающимися и рассуждающими системами" Исследование показывает: - Veo 3 решает многие задачи, для которых он не был обучен, используя только изображение + короткий запрос - он на пути к тому, чтобы стать универсальной моделью визуального фундамента, аналогичной LLM для языка - его рассуждения возникают через цепочку кадров (CoF) во времени, аналогично CoT