从零到英雄：通过合成数据注入和模型查询检测泄露数据

Oct, 2023

从零到英雄：通过合成数据注入和模型查询检测泄露数据

From Zero to Hero: Detecting Leaked Data through Synthetic Data Injection and Model Querying

Biao Wu, Qiang Huang, Anthony K. H. Tung

TL;DR为了保护数据的知识产权，在机器学习应用日益增多、且其成功与训练数据的质量密切相关的背景下，缺乏对未经授权的模型训练过程泄露数据的检测机制。本文针对表格数据领域，引入了一种名为局部分布偏移合成（LDSS）的新方法来检测训练分类模型所使用的泄露数据。LDSS 通过向拥有者的数据集注入一小部分具有局部类别分布偏移的合成数据，通过仅使用模型查询即可有效识别出训练于泄露和修改数据集的模型，且 LDSS 与朴素贝叶斯、决策树和随机森林等各种分类模型都兼容。在五个真实世界数据集上对七种分类模型进行了广泛实验，全面结果证实了 LDSS 的可靠性、稳健性、保真性、安全性和效率性。

Abstract

Safeguarding the intellectual property (IP) of data has become critically important as machine learning applications continue to prolifera

intellectual property data machine learning applications leaked data classification models

发现论文，激发创造

机器学习模型泄漏研究：对合成训练数据的探索

对于一个预测个人或家庭在接下来两年内搬迁的机器学习模型的攻击进行研究，该攻击假设攻击者可以查询模型以获取预测结果，并且模型的训练数据的边际分布公开可用。攻击还假设攻击者已获得了某些目标个体的非敏感属性的值，攻击的目标是推断出这些目标个体的敏感属性值。我们探讨了在训练模型时用合成数据替换原始数据对攻击者成功推断敏感属性的影响。

Oct, 2023

衡量和减轻表格生成模型的隐私风险

合成数据和生成模型在隐私保护的数据共享解决方案中迅速崛起，并通过在表格综合机上实施全面的实证分析，突出了五种最先进表格综合机的实用 - 隐私权衡，提出了一个新的差分隐私表格潜在扩散模型，称为 DP-TLDM，能够在保持可比较的隐私风险水平的同时，显著提高合成数据的实用性。

Mar, 2024

通过合成文本生成实现差分隐私知识蒸馏

利用差分隐私的知识蒸馏算法，通过利用合成数据和教师模型的输出分布，成功地在压缩自回归型大型语言模型的同时保护训练数据的隐私。

Mar, 2024

如何在文本图像扩散模型中检测未经授权的数据使用

通过向受保护的数据集中注入记忆注入，我们提出了一种检测未经授权的数据使用的方法，分析模型是否对注入内容进行了记忆，从而可以检测非法使用未经授权数据的情况。

Jul, 2023

利用大型语言模型生成私有合成文本

本文研究了使用敏感数据集生成新的差分隐私数据集作为替代方法，通过使用预先训练好的生成式语言模型并在敏感数据上进行私有调优，然后利用该模型可以产生差分隐私合成数据集，同时展示了训练目标及少调参数可提高合成数据的质量并与直接使用差分隐私训练下游分类器性能竞争力几乎相同，还可用于调整同一模型等级的分类器。

Jun, 2023

振荡泄密：微调扩散模型能够放大生成的隐私风险

扩散模型存在隐私风险，其中 Shake-to-Leak (S2L) 是一种新的风险，通过操纵数据以微调预训练模型，可以增强现有的隐私风险，尤其在扩散模型下还比过去认识的更严重。

Mar, 2024

深入数据：有效替代式训练针对黑盒攻击

本文提出了一种新的替代训练视角，着重于设计在知识窃取过程中使用的数据分布，提出了多样化的数据生成模块来综合宽泛的分布的大规模数据，并引入对接近决策边界的数据进行对抗替换训练策略，两个模块的结合可以进一步提高替代模型和目标模型的一致性，大大提高了对抗攻击的有效性。

Apr, 2021

基于扩散式图像变体的鲁棒训练对抗数据

隐形功能型后门攻击对训练神经网络构成了严重的安全威胁，本文提出了一种基于扩散模型及知识蒸馏的新方法，能够在潜在受污染的数据集上训练模型，并生成具备对抗后门触发的鲁棒性的学生模型。

Oct, 2023

合成数据异常值：身份泄露导航

通过对合成数据的异常值进行分析，我们的研究发现链接攻击方式可能会导致异常值被重新识别，并且差分隐私等额外安全措施可以预防重新识别，但会损失数据可用性。

Jun, 2024

语义分割中的可靠性问题：我们能否使用合成数据？

本文挑战了最先进的生成模型，通过对稳定扩散进行微调，在语义分割方面自动生成合成数据以评估其可靠性。通过广泛实验，我们表明合成数据与真实异常数据的表现之间存在高度相关性，从而显示了该方法的有效性。此外，我们说明了如何利用合成数据来提高分割器的校准和异常检测能力。

Dec, 2023