BriefGPT.xyz
大模型
Ask
alpha
关键词
copyrighted materials
搜索结果 - 3
Digger: 大型语言模型训练中侵权内容的检测
介绍了一种用于检测和评估用于大型语言模型的训练数据集中的潜在版权书籍内容的详细框架,并提供了每个内容样本包含的可信度估计。通过模拟实验证实了该框架在识别和解决语言模型训练过程中的内容滥用方面的有效性,同时研究了这些数据集中来自名著的可识别引
→
PDF
6 months ago
我的艺术我的选择:对抗无序人工智能的防护
利用 My Art My Choice (MAMC) 方法,通过 UNet-based 生成器,对抗扩散模型,保护版权图片不受非法使用。
PDF
10 months ago
讲述记忆:ChatGPT/GPT-4 所知图书的考古学
通过数据考古,我们发现 OpenAI 模型已经记忆了大量的版权材料,并且记忆程度与这些书在网站上出现的频率相关。这些模型记忆未知书籍的能力使得文化分析的度量可靠性变得更加复杂,我们的研究表明,这些模型在记忆过的书籍上比非记忆书籍上表现得更好
→
PDF
a year ago
Prev
Next