May, 2024

马赛克记忆:大语言模型中模糊复制的版权陷阱

TL;DR基于模糊复制品的版权陷阱在大型语言模型的记忆方面具有挑战性,这对 LLM 的记忆研究提出了一个前所未有的混淆因素,并对(精确的)数据去重作为隐私保护技术的有效性提出了质疑。