Jun, 2023

将上下文引入到文本对文本的隐私化

TL;DR该论文基于度量差分隐私技术,通过加入标定的噪声到单词的向量,并将这个嘈杂的向量通过最近邻搜索算法之后重新映射回离散词汇表,以实现文本到文本的保护。考虑到例如 ' 银行 ' 这样的歧义词,论文通过利用同义词的向量并结合歧义消解步骤来改进该机制,同时在隐私性和实用性方面进行评估。在 Words in Context 数据集上的单词意义消歧中,分类准确性提高了 6.05%。