SIGIRMay, 2018
SynTF: 用于隐私保护文本挖掘的合成和差分私有词项频率向量
SynTF: Synthetic and Differentially Private Term Frequency Vectors for Privacy-Preserving Text Mining
Benjamin Weggenmann, Florian Kerschbaum
TL;DR本文提出了一种基于向量空间模型的自动化文本匿名化方法,可用于保护作者的身份,并且实现了差分隐私,防止被重新辨认。实验结果表明此方法对于文本分类任务的准确性影响较小,但对于作者识别技术的准确性影响很大。