迁移遗忘的数据选择

May, 2024

Data Selection for Transfer Unlearning

Nazanin Mohammadi Sepahvand, Vincent Dumoulin, Eleni Triantafillou, Gintare Karolina Dziugaite

TL;DR深度学习模型、机器取消学习、迁移取消学习、数据筛选、测试准确率。

Abstract

As deep learning models are becoming larger and data-hungrier, there are growing ethical, legal and technical concerns over use of data: in practice, agreements on data use may change over time, rendering previously-used training data impermissible for training purposes. These issues h

deep learning models machine unlearning transfer unlearning data selection test accuracy

发现论文，激发创造

机器取消学习：解决方案与挑战

机器遗忘是一项关键技术，用于选择性地移除训练数据点对训练模型的影响。本文提供了机器遗忘研究的全面分类和分析，并回顾了最新的解决方案，讨论了其优势和限制，并提出了未来的发展方向，以推动机器遗忘作为一项必要的可信和自适应机器学习能力。

Aug, 2023

学习如何忘却：机器遗忘调查

该调查提供了机器遗忘技术的简明评估，概述了准确和近似方法、可疑攻击和验证方法，并比较了每种方法的优点和局限性，评估了它们的性能，突出了挑战性的需求。提供强大的非 IID 删除模型以缓解公平性问题，并指出该领域未来的研究方向，旨在为寻求在 ML 系统中提供隐私和平等的研究人员和从业者提供有价值的资源。

May, 2023

机器遗忘：一项全面调查

该研究综述了现有的机器去学习方法，系统地分类并讨论了其差异、联系和开放问题，包括集中式去学习、分布式和不规则数据去学习、去学习验证以及隐私和安全问题，并提出了潜在的研究方向。

May, 2024

公平的机器遗忘：数据去除与减轻偏差

在本研究中，我们提出了第一个可以证明并高效地消除数据实例并保持公平性的机器遗忘方法。通过理论结果和对真实世界数据集的广泛实验，我们展示了我们的方法在消除数据实例的同时保持公平性的功效。

Jul, 2023

任务感知的机器遗忘及其在负荷预测中的应用

该论文介绍了一种专门设计用于在已经训练好的预测器上移除原始数据集中影响的机器遗忘算法，提出了一个性能感知算法来权衡遗忘完整性和性能衰减，并且还提出了一个任务感知的机器遗忘算法来考虑调度和再调度问题，通过模拟验证了遗忘算法在负载预测器上的性能。

Aug, 2023

上下文学习中的不可学习算法

机器去学习是一项理想的操作，然而实现精确的去学习是具有挑战性或低效的，这篇论文关注于大型语言模型的任务适应阶段的高效去学习方法，并提供了一种算法来选择少量训练样本进行任务适应，最终得出在上下文学习方面比微调方法更有优势的结论。

Feb, 2024

一种更实用的机器取消学习方法

机器学习中的模型撤销能够有效解决数据隐私问题，本研究通过实证评估表明首次梯度上升法在机器学习中的撤销过程更为有效，突出了其在提升数据隐私和符合法规（如 GDPR 和 CCPA）方面的潜力。

Jun, 2024

机器特征与标签的无关量度探索

面对分布变化的复杂机器遗忘问题，特别关注非均匀特征和标签删除带来的挑战，本研究提出了一种基于影响函数和分布独立原理的新方法，以解决隐私保护和模型性能之间的平衡，通过在多样分布下维护模型的性能和适应性，确保数据去除的高效性及动态调整模型以保持泛化能力，通过广泛实验验证了方法的有效性，对机器遗忘领域做出了重大贡献。

Mar, 2024

通过可转移的不可学习示例实现通用的数据保护

本篇论文介绍了一种创新的数据保护方法，通过生成可转移的数据遗忘样本，从数据分布的角度考虑数据隐私问题，经过广泛实验证实了该方法的优越性能和保护能力。

May, 2023

如何应对忘却困难问题

机器遗忘是从训练模型中删除某个子集（即 “遗忘集”）的效果，而不损害模型的效用，例如遵守用户要求删除他们的数据，或删除错误标记、被污染或其他有问题的数据。本文通过调查两个影响遗忘难度和算法性能的关键因素，发现基于这些因素的遗忘集评估揭示了先进算法的新行为，从而改善了顶级的遗忘算法。

Jun, 2024