Ce-ar fi dacă am putea învăța AI să genereze mișcarea umană la fel de bine cum generează videoclipuri? Cercetători de la NTU, SenseTime, Tsinghua, CUHK și NVIDIA prezintă ViMoGen. Au construit un nou set de date masiv și un model de difuzie care transferă cunoștințe de la generarea avansată de video la crearea de mișcare. Rezultatul? Aceasta depășește semnificativ metodele existente în ceea ce privește calitatea mișcării, acuratețea la prompturi și generalizarea la scenarii noi. Căutarea generării mișcării generalizabile: date, model și evaluare Hârtie: Proiect: Raportul nostru: 📬 #PapersAccepted de Jiqizhixin