Bagaimana jika kita bisa mengajarkan AI untuk menghasilkan gerakan manusia serta menghasilkan video? Para peneliti dari NTU, SenseTime, Tsinghua, CUHK, & NVIDIA menghadirkan ViMoGen. Mereka membangun kumpulan data baru yang besar dan model difusi yang mentransfer pengetahuan dari pembuatan video tingkat lanjut ke dalam pembuatan gerakan. Hasilnya? Ini secara signifikan mengungguli metode yang ada dalam kualitas gerakan, akurasi perintah, dan generalisasi ke skenario baru. Pencarian Generasi Gerak yang Dapat Digeneralisasi: Data, Model, dan Evaluasi Kertas: Proyek: Laporan kami: 📬 #PapersAccepted oleh Jiqizhixin