大规模语言模型的实用取消学习
提出了一种称为“In-Context Unlearning”的LLM的反学习方法,通过在推理时提供具有翻转标签和额外正确标记的实例作为输入,有效地从训练集中删除特定信息,同时保持与最先进的反学习方法相媲美甚至超过其性能水平。
Oct, 2023
提出了一种高效的取消学习框架,通过引入轻量级的取消学习层并与transformers结合,可以在不对整个模型重新训练的情况下有效地更新大型语言模型,以解决用户数据隐私与数据保护法规的问题。实验证明,与现有技术相比,我们提出的方法在分类和生成任务上的有效性得到了验证。
Oct, 2023
探索机器遗忘(MU)在大型语言模型(LLMs)领域中的应用,称为LLM遗忘。通过维持基本知识生成的完整性且不影响非因果相关信息,旨在消除不良数据影响(例如敏感或非法信息)及相关模型能力,成为LLMs生命周期管理中的重要元素,潜在地作为开发生成式AI的基础,既安全、安全、可信,又无需完全重新训练的资源高效方法。从概念制定、方法论、度量和应用等方面研究LLMs遗忘领域。重点突出现有LLM遗忘研究中常被忽视的方面,例如遗忘范围、数据模型交互和多方面功效评估。并在LLM遗忘与模型编辑、影响函数、模型解释、对抗训练和强化学习等相关领域之间建立联系。此外,我们还概述了LLM遗忘的有效评估框架,并探讨了其在版权和隐私保护以及降低社会技术危害方面的应用。
Feb, 2024
通过对预训练大语言模型的机器遗忘进行综合研究,我们探讨了‘被遗忘权’的概念,重点关注了尚未充分研究的预训练模型领域。通过对来自arXiv、书籍和GitHub的精选数据集进行严格评估,我们建立了机器遗忘性能的鲁棒基准,并证明这些方法的计算效率比重新训练高出10^5倍。我们的研究结果表明,在分布数据上将梯度上升与梯度下降相结合可以提高超参数的稳健性。此外,我们还提供了高效超参数调整的详细指南。我们的发现推动了关于道德AI实践的讨论,为预训练大语言模型的机器遗忘机制提供了实质性的见解,并强调了负责任的AI发展的潜力。
Feb, 2024
大型语言模型开创了人工智能的进展,然而它们可能会危险地记忆和传播敏感、偏见或受版权保护的信息。机器遗忘作为一种尖端解决方案应运而生,针对大型语言模型提供了一种选择性丢弃某些数据的技术,以解决隐私、道德和法律方面的挑战,无需进行完整的模型重新训练。本文回顾了关于大型语言模型的机器遗忘的最新研究,介绍了针对文本数据和分类数据的遗忘方法,并展示了这些方法在删除特定数据的同时保持模型高效性的有效性。本文还强调了机器遗忘的实用性,指出了保持模型完整性、避免过度或不足的数据删除以及确保一致的输出等问题,突出了机器遗忘在推动负责任、道德的人工智能方面的作用。
Mar, 2024
通过提供深入探讨机器消遣技术的定义、分类和评价标准,以及不同环境下的挑战和解决方案,本文对传统模型和大型语言模型上的消遣进行分类和研究,提出了评估消遣效果和效率的方法以及性能测量标准。本文揭示了当前消遣技术的局限性,并强调了全面的消遣评估的重要性,以避免随意的遗忘。该调查不仅总结了消遣技术的关键概念,还指出了其突出问题和未来研究的可行方向,为该领域的学者提供了有价值的指导。
Apr, 2024
通过介绍一种新的遗忘框架Unlearning from Logit Difference(ULD),该方法通过计算目标模型与助理模型之间的逻辑差异来实现忘记目标文档和保留其他知识的目标,从而解决了LLM遗忘方法中的两个挑战问题(退化输出和灾难性遗忘),大幅提高了训练效率。
Jun, 2024
我们提出了衡量实际效能的一组度量标准,并提出了几种控制方法以规范过多的遗忘。经过在已建立的基准测试上的实验分析,我们得出结论,基于梯度上升的方法在实践中并不完美,强烈的遗忘会以牺牲模型实用性的代价为代价。我们得出结论,朝着实际和有效的大型语言模型遗忘还有很长的路要走,并需要在这个领域投入更多的努力。
Jun, 2024
机器遗忘是一种有效地通过事后修改模型来消除特定知识的方法,在本文中,我们提出了一个用于大型语言模型(LLMs)遗忘的真实世界知识遗忘基准(RWKU),该基准考虑了任务设置、知识来源和评估框架等关键因素。
Jun, 2024