Feb, 2022

使用身份信息数据增强方法实现文本分类任务的公平性

TL;DR本文提出了一种两步数据增强过程,第一步是使用词嵌入方法准备身份对的全面列表,第二步是利用身份对列表通过三种简单的操作(即身份对替换、身份项盲目替换和身份对交换)增强训练实例,实验结果表明,这个增强过程可以产生多样化的身份对,并提高了基于令牌的反事实公平度量得分,适用于两个文本分类任务。