May, 2023

使用邻居比较攻击语言模型的成员推断

TL;DR本研究探讨了参考模型攻击在更现实的情况下对数据分布的脆弱性,并提出并评估了领域攻击方法,以提高模型隐私性。