EMNLPOct, 2023

使用零射击启发局部差分隐私文档生成

TL;DR使用 DP-Prompt 及类似 ChatGPT 的强大语言模型在 IMDB 数据集上进行实验,发现其能够有效减少 de-anonymization 攻击成功率,并在与现有方法相比设计更简单的情况下,完全恢复了清洁情感 F1 分数,同时在对抗静态攻击者和自适应攻击者方面分别实现了 46% 和 26% 的减少