快速而有效的机器遗忘
我们提出了一种新的类别遗忘算法,通过估计待保留和遗忘类别的特征或激活空间,并计算这些空间之间的共享信息,从而实现有效的机器遗忘,并在各种图像分类数据集和网络架构中相比其他基准算法效果明显提高,且计算效率提高了约 6 倍。
Dec, 2023
机器遗忘是一项关键技术,用于选择性地移除训练数据点对训练模型的影响。本文提供了机器遗忘研究的全面分类和分析,并回顾了最新的解决方案,讨论了其优势和限制,并提出了未来的发展方向,以推动机器遗忘作为一项必要的可信和自适应机器学习能力。
Aug, 2023
该调查提供了机器遗忘技术的简明评估,概述了准确和近似方法、可疑攻击和验证方法,并比较了每种方法的优点和局限性,评估了它们的性能,突出了挑战性的需求。提供强大的非 IID 删除模型以缓解公平性问题,并指出该领域未来的研究方向,旨在为寻求在 ML 系统中提供隐私和平等的研究人员和从业者提供有价值的资源。
May, 2023
这篇研究论文提出了一种名为部分盲目遗忘(PBU)的新方法,通过从预训练的分类网络中有选择地删除与特定数据类别相关的信息,实现对特定数据类别的有意去除,以降低模型对该类别数据的性能影响,且无需了解整个训练数据集,仅需了解未遗忘数据点。
Mar, 2024
在当前人工智能时代中,用户可能要求 AI 公司从训练数据集中删除他们的数据以保护隐私。作为模型所有者,重新训练模型将消耗大量计算资源。因此,机器遗忘是一种新兴的技术,允许模型所有者删除请求的训练数据或一个类别,对模型性能影响较小。然而,对于大规模复杂的数据,如图像或文本数据,从模型中删除一个类别会导致性能下降,因为很难确定类别和模型之间的联系。本文中,为了准确定义复杂数据的遗忘类别,我们应用概念的定义来代表遗忘类别的语义信息,而不是图像特征或文本数据的标记。这种新的表示可以切断模型和类别之间的联系,从而完全消除一个类别的影响。为了分析复杂数据概念的影响,我们采用后验概念瓶颈模型和综合梯度来精确识别不同类别之间的概念。接下来,我们利用带有随机和有针对性标签的数据毒化提出了遗忘方法。我们在图像分类模型和大型语言模型上测试了我们的方法,结果一致表明提出的方法可以准确地从模型中擦除目标信息,并且可以在很大程度上保持模型的性能。
May, 2024
本文提出了一种名为 WF-Net 的框架,通过内存矩阵调制图像分类网络的内部组件,以实现对所有类别的快速撤销,并发现适用于每个类别的权重,从而恢复了一种设计可解释的类别表示方式。
Apr, 2023
本文旨在对机器学习模型中 “遗忘特定数据” 的概念、场景、方法和应用进行综合性探讨,并为研究人员和从业人员提供包括设计标准和算法在内的全面资源,以帮助创新隐私技术和提醒相关研究领域存在的问题。
Sep, 2022
该论文介绍了一种专门设计用于在已经训练好的预测器上移除原始数据集中影响的机器遗忘算法,提出了一个性能感知算法来权衡遗忘完整性和性能衰减,并且还提出了一个任务感知的机器遗忘算法来考虑调度和再调度问题,通过模拟验证了遗忘算法在负载预测器上的性能。
Aug, 2023
机器学习模型面对大规模互联网数据集引起的数据完整性挑战,本研究探讨在检测到数据被篡改或错误时模型开发者能够做出的应对措施。我们将 “修正机器遗忘” 定义为解决训练模型中受未知篡改影响数据的问题,尽管只能知道受影响样本的一个小部分。我们发现修正遗忘问题与传统的注重隐私的遗忘方法有显著不同的要求。我们希望我们的工作能促进对修正遗忘方法的研究,为处理来自于大规模网络训练带来的数据完整性挑战的从业者提供新的策略。
Feb, 2024