Aug, 2018

文本数据种的人口属性对抗性剔除

TL;DR本篇论文通过实验证明,作者的人口统计信息可以从神经分类器中间表示中被检测出来;在尝试用对抗性训练去除这些信息时,该方法效果不佳,需要注意敏感特征的不变表示不应仅依赖于对抗性训练。