Google DeepMind vydal klíčový dokument o vizuální inteligenci: "Videomodelky se učí a uvažují s nulovou scenérií" Výzkum ukazuje: - Veo 3 řeší mnoho úkolů, na které nebyl trénován, pouze pomocí obrázku + krátké nápovědy - je na dobré cestě stát se univerzálním modelem pro založení vize, podobně jako LLM pro jazyk - jeho uvažování se objevuje prostřednictvím řetězce rámců (CoF) napříč časem, podobně jako CoT