文本反学习带来了一种虚假的反学习感知

Jun, 2024

文本反学习带来了一种虚假的反学习感知

Textual Unlearning Gives a False Sense of Unlearning

Jiacheng Du, Zhibo Wang, Kui Ren

TL;DR通过借助先前和后续模型访问，我们提出了文本消除泄漏攻击（TULA），从而证明机器遗忘在语言模型中会扩大知识泄漏的风险，包括黑盒和白盒场景下推断未学习数据的能力增强，以及通过白盒访问直接重构未学习数据的准确性。这项工作首次揭示了语言模型中的机器遗忘逆向创造了更大的知识风险，并鼓励更安全的遗忘机制的发展。

Abstract

language models (LMs) are susceptible to "memorizing" training data, including a large amount of private or copyright-protected content. To safeguard the right to be forgotten (RTBF), machine unlearning has emerg

发现论文，激发创造

语言模型中知识退化以减少隐私风险

本研究提出知识遗忘（knowledge unlearning）作为一种减少预训练语言模型（pretrained language models）隐私风险的方法，通过对目标标记序列进行梯度上升来遗忘它们，并发现顺序遗忘优于尝试一次性遗忘所有数据，对于特定领域的数据，知识遗忘具有更强的实证隐私保证，同时更加高效和鲁棒。

Oct, 2022

学习如何忘却：机器遗忘调查

该调查提供了机器遗忘技术的简明评估，概述了准确和近似方法、可疑攻击和验证方法，并比较了每种方法的优点和局限性，评估了它们的性能，突出了挑战性的需求。提供强大的非IID删除模型以缓解公平性问题，并指出该领域未来的研究方向，旨在为寻求在ML系统中提供隐私和平等的研究人员和从业者提供有价值的资源。

May, 2023

机器遗忘中的威胁、攻击与防御: 一项综述

机器去学习的关键概念、影响因素和机制的综述，提供对威胁和防御的分类、方法和解决方案的建议，以促进未来研究和实际应用的发展。

Mar, 2024

对于每个(文本序列)的独立性：改进大型语言模型中的记忆数据遗忘

通过新的度量衡、对抗攻击以及基于梯度上升和任务算术的两种新的遗忘方法，本研究提供了关于LLMs隐私保护和遗忘的新视角，并在大量NLP任务上进行了全面的性能评估。

May, 2024

多语言语言模型中选择性知识的跨语言遗忘

本研究论文提出了一种创新的方法，针对多语言语言模型的机器遗忘，通过选择性地擦除不同语言中的信息，同时保持总体性能，有效解决了低资源语言攻击的问题，为安全可适应的多语言语言模型设定了新的标准。

Jun, 2024

有针对性的重学习攻击对未学习的模型进行记忆激活

机器不学习是一种减轻机器学习模型中训练数据不良记忆的有希望的方法。然而，在这项工作中，我们显示出现有的LLMs取消学习方法意外地容易受到一组简单有针对性的重新学习攻击的影响。通过仅访问少量可能松散相关的数据集，我们发现可以“调整”取消学习模型的记忆以逆转取消学习的效果。我们系统地阐述了这种取消学习-重新学习流程，探索了三个流行的取消学习基准测试中的攻击，并讨论了我们研究的结果产生的未来方向和指南。

Jun, 2024

非非学习：在先进生成型人工智能中，非学习不足以进行内容监管

该论文讨论了在大型语言模型中使用取消学习作为一种控制机制，并发现取消学习在训练阶段是有效的，但无法阻止模型在推断过程中出现不合规的行为，因此对于有效的内容规范，需要进行内容过滤以及引入取消取消学习的概念来解决问题。

Jun, 2024

朝着鲁棒的知识遗忘：一种用于评估和提高大语言模型遗忘鲁棒性的对抗框架

本研究解决了现有大语言模型在知识遗忘过程中容易受到对抗性查询攻击的问题。我们提出了动态遗忘攻击(DUA)框架，对模型的脆弱性进行评估，同时提出了潜在对抗遗忘(LAU)框架，采用最小-最大优化方法提高遗忘过程的鲁棒性。实验表明，我们的方法显著提升了遗忘有效性超过53.5%，有效抵御了知识再显现。

Aug, 2024

遗忘以繁荣：利用机器遗忘技术解决预训练语言模型隐私泄露问题

本研究解决了在私人数据上微调大型语言模型时可能带来的隐私风险。我们提出了一种新颖的攻击方法——模型遗忘技术，利用这一技术提升了隐私数据泄露的可能性，并在验证中显示出显著优于基线的效果。这项研究警示用户下载未经验证的预训练模型时可能面临的风险。

Aug, 2024

您的大型语言模型真的遗忘了吗？一种令人尴尬的简单方法来恢复被遗忘的知识

本研究解决了大型语言模型在机器遗忘过程中是否真正实现遗忘的问题，指出现有方法可能只是隐藏了知识，而非完全遗忘。通过对量化技术的深入实验，发现经过遗忘处理的模型在不同精度下显著保留了遗忘知识，提出了一种量化稳健的遗忘策略，旨在优化遗忘效果并提升模型的实用性。

Oct, 2024