BriefGPT.xyz
Ask
alpha
关键词
data deduplication
搜索结果 - 3
ACL
朝着更现实的提取攻击:一种对抗性视角
利用对语言模型的脆弱性,我们从对抗性的角度重新审视了提取攻击,发现即使对提示进行微小、不符合直觉的更改,或者针对较小的模型和旧的检查点,也可以将提取风险增加 2-4 倍。此外,仅依赖广泛接受的逐字匹配低估了提取信息的真实范围,我们提供了其他
→
PDF
4 days ago
马赛克记忆:大语言模型中模糊复制的版权陷阱
基于模糊复制品的版权陷阱在大型语言模型的记忆方面具有挑战性,这对 LLM 的记忆研究提出了一个前所未有的混淆因素,并对(精确的)数据去重作为隐私保护技术的有效性提出了质疑。
PDF
a month ago
MEDBERT.de:医疗领域全面德语 BERT 模型
本文提出了一个针对德语医疗领域的预先训练的德语 BERT 模型,经过 4.7 百万德文医学文档的大规模语料库训练,取得了国内外八个医学基准测试的最新的最优表现。在评估模型整体性能的同时,本文对模型的能力进行了更深入的分析,探讨了数据去重对模
→
PDF
a year ago
Prev
Next