Oct, 2023

从零到英雄:通过合成数据注入和模型查询检测泄露数据

TL;DR为了保护数据的知识产权,在机器学习应用日益增多、且其成功与训练数据的质量密切相关的背景下,缺乏对未经授权的模型训练过程泄露数据的检测机制。本文针对表格数据领域,引入了一种名为局部分布偏移合成(LDSS)的新方法来检测训练分类模型所使用的泄露数据。LDSS 通过向拥有者的数据集注入一小部分具有局部类别分布偏移的合成数据,通过仅使用模型查询即可有效识别出训练于泄露和修改数据集的模型,且 LDSS 与朴素贝叶斯、决策树和随机森林等各种分类模型都兼容。在五个真实世界数据集上对七种分类模型进行了广泛实验,全面结果证实了 LDSS 的可靠性、稳健性、保真性、安全性和效率性。