BriefGPT.xyz
大模型
Ask
alpha
关键词
verbatim memorization
搜索结果 - 2
EMNLP
侵权与大型语言模型
本研究通过对语言模型的逐字记忆进行探索,重点关注版权文字的再分发可能性,通过对一系列热门图书和编码问题进行实验,提供了个人估计的语言模型再分发这些材料的程度。总体而言,本研究强调了进一步研究的必要性,以及对版权法规遵守的潜在影响和未来自然语
→
PDF
8 months ago
语言模型防止机械背诵,误导隐私保障
通过 Bloom 过滤器与 ALL-CAPITAL text 跨越数据记忆的问题,阐述了训练数据的记忆问题与风险,并讨论了针对神经语言模型中数据记忆的潜在替代定义和本质难题。
PDF
2 years ago
Prev
Next