LLM могут запоминать и раскрывать конфиденциальные данные из обучающего набора, что создает серьезные риски для конфиденциальности. Смелые исследователи разработали новый метод с открытым исходным кодом для обнаружения этого запоминания и утечки информации. 🧵
Утечки обучающих данных могут угрожать как отдельным лицам, так и учреждениям. Представьте себе медицинскую LLM, обученную на клинических записях, случайно раскрывающую конфиденциальную информацию о пациентах. Или LLM, обученную на документах компании, которую злоумышленник обманом заставляет воспроизводить частные сообщения.
12,78K