BriefGPT.xyz
大模型
Ask
alpha
关键词
sensitive training content
搜索结果 - 1
文本反学习带来了一种虚假的反学习感知
通过借助先前和后续模型访问,我们提出了文本消除泄漏攻击(TULA),从而证明机器遗忘在语言模型中会扩大知识泄漏的风险,包括黑盒和白盒场景下推断未学习数据的能力增强,以及通过白盒访问直接重构未学习数据的准确性。这项工作首次揭示了语言模型中的机
→
PDF
15 days ago
Prev
Next