Mar, 2024

幽灵句子:一个供普通用户从大型语言模型中申请数据版权的工具

TL;DR通过在用户文档中插入隐藏密码句子,可以确认大型语言模型(LLM)是否未经许可滥用用户数据,该研究介绍了一种版权工具,用于识别 LLM 生成内容中的用户数据,通过 ghost sentences 任务定义用户训练数据的识别,并使用文档和用户识别准确率等指标进行评估。