Oct, 2023

带隐私风险指标的神经文本清洗:实证分析

TL;DR文本消毒是将文档进行编码以掩盖其中所有(直接或间接的)个人标识符的任务,以掩盖所指个体的身份。本文考虑了一种两步法的文本消毒方法,并对其在最近发布的两个数据集(Text Anonymization Benchmark 和一组维基百科传记)上的实证表现进行了详细分析。