Jun, 2024

数据剽窃指数:表格生成模型中的数据复制隐私风险特征

TL;DR该论文提出了一种新的相似性度量和数据剽窃指数(DPI)来评估表格数据的数据复制,并表征了相应的隐私风险。同时,论文指出 DPI 鉴定的数据复制对常见的高性能架构而言存在隐私和公平威胁,强调了需要更复杂的生成模型技术来减轻这个问题。