Jun, 2024
数据剽窃指数:表格生成模型中的数据复制隐私风险特征
Data Plagiarism Index: Characterizing the Privacy Risk of Data-Copying in Tabular Generative Models
Joshua Ward, Chi-Hua Wang, Guang Cheng
TL;DR该论文提出了一种新的相似性度量和数据剽窃指数(DPI)来评估表格数据的数据复制,并表征了相应的隐私风险。同时,论文指出 DPI 鉴定的数据复制对常见的高性能架构而言存在隐私和公平威胁,强调了需要更复杂的生成模型技术来减轻这个问题。