BriefGPT.xyz
大模型
Ask
alpha
关键词
copyrighted content
搜索结果 - 6
通过机器遗忘来避免版权侵权
在这篇论文中,我们提出了一种稳定的序列遗忘(SSU)框架,该框架使用任务向量,通过引入额外的随机标签损失和应用基于梯度的权重显著性映射,以更稳定的方式在不同的时间步骤中从 LLMs 中删除受版权保护的内容,实验证明 SSU 在遗忘效果和保持
→
PDF
18 days ago
大型语言模型中的机器遗忘
机器遗忘是人工智能中的一个新领域,专注于解决在机器学习模型中有选择地遗忘或减少不良知识或行为的挑战,特别是在大型语言模型(LLM)的背景下。本文介绍了一种使用梯度上升算法对 LLM 进行对齐的方法,以便符合伦理、隐私和安全标准,并目标性地删
→
PDF
a month ago
DE-COP:检测语言模型训练数据中的版权内容
我们提出了 DE-COP 方法,通过向语言模型提出包含直接引文和释义的多项选择题,来确定受版权保护的内容是否包含在训练中。我们构建了 BookTection 基准测试集,其中包含了 165 本在模型训练截止日期之前和之后出版的书籍摘录及其释
→
PDF
5 months ago
谁是哈利・波特?在 LLMs 中的近似遗忘
我们提出了一种新的技术来从 LLM 中遗忘训练数据的子集,而无需重新训练它,该技术在 Harry Potter 相关内容的生成或召回方面具有有效的能力。这是首篇呈现生成式语言模型中遗忘有效技术的论文。
PDF
9 months ago
ICML
面向互联网规模文本到图像扩散模型的安全自蒸馏
本文提出了一种叫做 SDD 的方法,可以在图像生成模型中避免生成有害内容,该方法相对于之前的方法可以更彻底地除去生成图像中的有害内容,同时保持图像的整体质量,并且能够一次性去除多个概念。
PDF
a year ago
版权是否可以归结于隐私?
该论文探讨如何使用算法稳定技术保护受版权保护的内容免受生成 AI 模型的影响,并指出只是采用这些技术并不能等同于保护版权内容。
PDF
a year ago
Prev
Next