BriefGPT.xyz
Ask
alpha
关键词
copyrighted data
搜索结果 - 3
找到 NeMo: 在扩散模型中定位负责记忆的神经元
通过定位跨注意力层中的神经元,我们引入了 NeMo 方法来解决扩散模型中的个别数据样本的记忆问题,从而避免了在推理过程中复制训练数据,增加了生成输出的多样性,并减少了私密和受版权保护数据的泄露,进而实现了更负责任的扩散模型的部署。
PDF
a month ago
如何在大型语言模型的优化中保护版权数据?
利用训练大语言模型的理论方法,可以避免生成版权数据。
PDF
10 months ago
SILO 语言模型:在非参数化数据存储中隔离法律风险
通过在开放许可的文本语料库(OLC)上训练参数化的语言模型,并在推断过程中使用包含有版权内容的数据存储库,SILO 模型能够在满足数据使用法规(如美国的公平使用原则和欧盟的 GDPR)的同时提高模型的性能。
PDF
a year ago
Prev
Next