Các mô hình ngôn ngữ khuếch tán (DLMs) là những bộ lấy mẫu song song tối ưu được chứng minh! Trong bài báo mới của tôi với @nhaghtal và @wjmzbmr1, chúng tôi chỉ ra rằng DLMs có thể lấy mẫu các phân phối với số bước tối thiểu có thể, và hơn nữa với bộ nhớ tối thiểu có thể với việc sửa đổi/làm lại.
Liệu Transformers có thể làm mọi thứ và cũng có thể hoàn tác không?
Hãy xem blog của tôi về việc liệu các mô hình ngôn ngữ có phải là surjective, injective, hay invertible không!