SIGIRMay, 2018

SynTF: 用于隐私保护文本挖掘的合成和差分私有词项频率向量

TL;DR本文提出了一种基于向量空间模型的自动化文本匿名化方法,可用于保护作者的身份,并且实现了差分隐私,防止被重新辨认。实验结果表明此方法对于文本分类任务的准确性影响较小,但对于作者识别技术的准确性影响很大。