Các LLM có thể ghi nhớ và rò rỉ dữ liệu nhạy cảm trong quá trình đào tạo, gây ra những rủi ro nghiêm trọng về quyền riêng tư. Các nhà nghiên cứu dũng cảm đã phát triển một phương pháp mã nguồn mở mới để phát hiện việc ghi nhớ và rò rỉ thông tin này. 🧵
Các lỗ hổng dữ liệu đào tạo có thể đe dọa cả cá nhân và tổ chức. Hãy tưởng tượng một mô hình ngôn ngữ lớn (LLM) y tế được đào tạo trên các ghi chú lâm sàng vô tình tiết lộ thông tin nhạy cảm của bệnh nhân. Hoặc một LLM được đào tạo trên các tài liệu công ty bị kẻ tấn công lừa đảo để tái sản xuất các thông tin liên lạc riêng tư.
15,46K