他們說視頻模型無法學習物理……