大型语言模型的版权陷阱

Feb, 2024

Matthieu Meeus, Igor Shilov, Manuel Faysse, Yves-Alexandre de Montjoye

TL;DR利用版权陷阱检测大型语言模型中的版权材料，通过研究版权保护的内容的公平使用和训练模型中的内容是否可被检测，提出了一种实验设计，并发现较长的序列经过重复多次可以可靠地检测出来，并通过研究序列出现次数及困惑度，以及考虑上下文的方法进一步改善了检测能力。

Abstract

Questions of fair use of copyright-protected content to train Large Language Models (LLMs) are being very actively debated. Document-level inference has been proposed as a new task: inferring from black-box acces

fair use copyright-protected content large language models copyright traps detectability

发现论文，激发创造

Digger: 大型语言模型训练中侵权内容的检测

介绍了一种用于检测和评估用于大型语言模型的训练数据集中的潜在版权书籍内容的详细框架，并提供了每个内容样本包含的可信度估计。通过模拟实验证实了该框架在识别和解决语言模型训练过程中的内容滥用方面的有效性，同时研究了这些数据集中来自名著的可识别引用语的存在。研究结果对于确保版权材料在语言模型开发中的合理使用具有重要意义，强调了在该领域需要更加透明和负责任的数据管理实践。

Jan, 2024

马赛克记忆：大语言模型中模糊复制的版权陷阱

基于模糊复制品的版权陷阱在大型语言模型的记忆方面具有挑战性，这对 LLM 的记忆研究提出了一个前所未有的混淆因素，并对（精确的）数据去重作为隐私保护技术的有效性提出了质疑。

May, 2024

侵权与大型语言模型

本研究通过对语言模型的逐字记忆进行探索，重点关注版权文字的再分发可能性，通过对一系列热门图书和编码问题进行实验，提供了个人估计的语言模型再分发这些材料的程度。总体而言，本研究强调了进一步研究的必要性，以及对版权法规遵守的潜在影响和未来自然语言处理发展的潜在影响。

Oct, 2023

TRAP: 针对黑盒识别的有针对性随机对抗提示诱饵

通过使用名为 TRAP 的方法，本研究介绍了一种新颖的黑盒身份验证问题，该方法可以检测出特定的大型语言模型 (LLM) 在第三方应用程序中的使用，以确保 LLM 的合规性和防止滥用。TRAP 方法使用对越狱提出的敌对后缀，从目标 LLM 获取预定义答案，而其他模型则给出随机答案。TRAP 在仅进行一次交互后，可以以超过 95% 的真阳性率和 0.2% 以下的假阳性率检测到目标 LLMs。即使 LLM 进行了微小变化且原始功能未明显改变，TRAP 仍然有效。

Feb, 2024

LLM 数据推断：你在我的数据集上训练了吗？

大语言模型在现实世界中的大量使用产生了对公司以未经许可的方式在互联网上训练模型的版权纠纷。本文提出了一种新的数据集推断方法来准确识别用于训练大语言模型的数据集，成功地区分了不同子集的 Pile 数据集的训练集和测试集，无任何错误的正例。

Jun, 2024

大型语言模型可以引导逃避 AI 生成的文本检测

在该研究中，我们提出了一种新颖的基于替换的上下文示例优化方法（SICO），通过精心设计的提示语，有效地使 ChatGPT 躲避现有的六个检测器，揭示了现有检测器的易感性，并展示了 SICO 的强大性能和可靠性，证实其作为该领域任何新检测器的有效评估协议。

May, 2023

评估语言模型的版权下架方法

本文介绍了对语言模型版权撤回方法的可行性和副作用的首次评估，并提出了 CoTaEval 评估框架，以评估版权撤回方法的有效性、对模型保留非受版权限制的事实性知识的影响，以及模型在保持整体效用和效率方面的表现。通过添加系统提示、解码时的过滤干预和去学习方法等几种策略的研究，我们的发现表明，在所有指标上没有测试的方法表现出色，这表明在这个独特的问题设置中还有重要的研究空间，并暗示现行政策提议中可能存在未解决的挑战。

Jun, 2024

语言语模与记忆：版权合规的质量和特定性

采用欧洲法律为例，本研究提出了一种系统分析方法， quantifying potential copyright infringements in large language models (LLMs)。通过使用 160 个字符的阈值和模糊文本匹配算法，研究分析了指导微调模型在真实终端用户场景中的行为和特征。该研究结果发现在几种主流的 LLMs 中对版权合规、行为特征和适当拒绝方面表现出巨大差异。

May, 2024

幽灵句子：一个供普通用户从大型语言模型中申请数据版权的工具

通过在用户文档中插入隐藏密码句子，可以确认大型语言模型（LLM）是否未经许可滥用用户数据，该研究介绍了一种版权工具，用于识别 LLM 生成内容中的用户数据，通过 ghost sentences 任务定义用户训练数据的识别，并使用文档和用户识别准确率等指标进行评估。

Mar, 2024

如何在大型语言模型的优化中保护版权数据？

利用训练大语言模型的理论方法，可以避免生成版权数据。

Aug, 2023