他们说视频模型无法学习物理……