BriefGPT.xyz
大模型
Ask
alpha
关键词
data extraction attacks
搜索结果 - 3
通过伪标记成员的微调增强训练数据曝光
通过对神经语言模型进行对抗性微调,以增强其对预训练数据的保留,本文介绍了一种新的攻击场景。通过使用伪标签进行生成文本的成员近似,我们证明了使用更高的成员概率进行微调能够使模型暴露训练数据增加四到八倍。
PDF
4 months ago
大型语言模型中的记忆痕迹对于代码的影响
大语言模型在编程领域备受瞩目,然而其数据源可能面临被攻击者利用数据提取攻击进行窃取的风险,本研究对大语言模型进行了代码和自然语言两方面的对比研究并发现其对数据提取攻击存在漏洞,建议进一步研究并采取相应措施来缓解此问题。
PDF
7 months ago
SATML 语言模型数据提取挑战中针对 GPT-Neo 的有目标攻击
应用有针对性的数据提取攻击考察了 SATML2023 语言模型训练数据提取挑战,并通过两步骤的方法成功地从中提取了样本,其中第一步骤成功提取 69%的样本的后缀;接着,使用基于分类器的成员推断攻击对生成式进行检测,其 AutoSklearn
→
PDF
a year ago
Prev
Next