Mar, 2022

使用成员推断攻击量化掩码语言模型的隐私风险

TL;DR使用类似于似然比假设检验的成员推理攻击方法,我们发现面向医疗笔记的掩模语言模型泄漏训练数据的隐私风险非常高,表现为先前攻击的 AUC 从 0.66 提高到 0.9 级别,并且在低误差区域有显着提高:在 1%误报率的情况下,攻击效果比先前攻击提高了 51 倍。