Feb, 2024

大型语言模型的版权陷阱

TL;DR利用版权陷阱检测大型语言模型中的版权材料,通过研究版权保护的内容的公平使用和训练模型中的内容是否可被检测,提出了一种实验设计,并发现较长的序列经过重复多次可以可靠地检测出来,并通过研究序列出现次数及困惑度,以及考虑上下文的方法进一步改善了检测能力。