使用身份信息数据增强方法实现文本分类任务的公平性

Feb, 2022

使用身份信息数据增强方法实现文本分类任务的公平性

Fairness for Text Classification Tasks with Identity Information Data Augmentation Methods

Mohit Wadhwa, Mohan Bhambhani, Ashvini Jindal, Uma Sawant, Ramanujam Madhavan

TL;DR本文提出了一种两步数据增强过程，第一步是使用词嵌入方法准备身份对的全面列表，第二步是利用身份对列表通过三种简单的操作（即身份对替换、身份项盲目替换和身份对交换）增强训练实例，实验结果表明，这个增强过程可以产生多样化的身份对，并提高了基于令牌的反事实公平度量得分，适用于两个文本分类任务。

Abstract

counterfactual fairness methods address the question: How would the prediction change if the sensitive identity attributes referenced in the text instance were different? These methods are entirely based on generating counterfactuals for the given training and test set instances. Count

counterfactual fairness data augmentation identity pairs text classification fairness metric score

发现论文，激发创造

通过鲁棒性实现文本分类的反事实公平性

本文研究文本分类中的反事实公平性问题，提出了一种度量特定公平性形式 —— 反事实令牌公平性 (CTF) 的度量准则，利用三种方法 —— 盲化、反事实增强和反事实逻辑配对 (CL) 解决训练中的反事实令牌公平性优化问题，这些方法不会影响分类器性能，并且在小组公平性方面具有变化，为解决文本分类中的公平性问题提供了新的途径。

Sep, 2018

柔性文本生成用于反事实公平探究

本文介绍了一种使用大型语言模型生成对抗样本的方法，该方法克服了现有方法的局限性，能够产生复杂的对抗样本，并在 Civil Comments 数据集上比较了各种方法的性能和价值，并展示了其在评估毒性分类器方面的价值。

Jun, 2022

文本分类中的逆因果多令牌公平性

本文提出了一种名为 Counterfactual Multi-token Generation 的生成方案，通过扰动多个敏感 Token，可对各种形式的文本和文档实现更好的 Counterfactual 公平性，获得在多个基准数据集上显著的性能提升。

Feb, 2022

CAISA 在 SemEval-2023 任务 8 中：对因果声明识别中的分类不平衡进行反事实数据增强

使用逆向方法进行动词替换的新颖对抗数据增强技术在医疗赔付领域取得显著效果，可提高少数类的性能表现。

Jun, 2023

探究自动生成的反事实数据在情感分析中的有效性

提出了一种自动产生对立数据的方法，基于此数据增广训练集可以有效提高 NLP 模型的性能。

Jun, 2021

从观测数据中学习反事实公平性

本文提出了一种新的框架 CLAIRE，通过对反事实数据增广和不变化惩罚的表征学习框架有效地减轻了敏感属性的偏差，并在合成和真实数据集上的实验验证了 CLAIRE 在反事实公平性和预测性能方面的优越性。

Jul, 2023

用反事实表示解释文本分类器

通过在文本表示空间进行干预的简单方法生成对抗事实，以用于分类器解释和偏见缓解。

Feb, 2024

检测意外偏差的图像反事实敏感性分析

本研究提出了一种名为图像反事实敏感性分析的框架，利用生成对抗网络建立一个面部图像的真实生成模型，以控制性地操作特定的图像特征，从而发现并检测面部分类器中的偏见和公平性。

Jun, 2019

通过自动生成的反事实情况实现文本分类中对伪相关性的鲁棒性

通过增加具有相反特性和标签的反事实数据来训练鲁棒的文本分类器，以强化模型可靠性和泛化性，实验证明，其在人工生成对照样本和原始测试数据上表现出较高的鲁棒性和精准度。

Dec, 2020

针对展示偏差的多模态学习的反事实数据增强

提出使用生成的对应事实标签进行校正的反事实增强技术，以解决基于用户行为所导致呈现偏倚问题。经验证，该技术比现有的校正方法以及未校正模型产生更好的性能，并且在理想情况下所生成的对应事实与真实对应事实非常接近。

May, 2023