关系分类生成对抗样本的自动化方法

Feb, 2022

关系分类生成对抗样本的自动化方法

Automatically Generating Counterfactuals for Relation Classification

Mi Zhang, Tieyun Qian, Ting Zhang

TL;DR本文提出了一种从以实体为中心的视角生成相关对照数据的方法，通过在句法和语义依赖图中利用两个基本的拓扑性质，即中心性和最短路径来识别和干预实体的语境因果特征，从而使得深度神经模型更加稳健。

Abstract

The goal of relation classification (RC) is to extract the semantic relations between/among entities in the text. As a fundamental task in natural language processing, it is crucial to ensure the robustness of RC models. Despite the high accuracy current →

relation classification deep neural models counterfactually augmented data entity-centric viewpoint contextual counterfactuals

发现论文，激发创造

通过自动生成的反事实情况实现文本分类中对伪相关性的鲁棒性

通过增加具有相反特性和标签的反事实数据来训练鲁棒的文本分类器，以强化模型可靠性和泛化性，实验证明，其在人工生成对照样本和原始测试数据上表现出较高的鲁棒性和精准度。

Dec, 2020

AutoCAD: 生成对策让模型克服快捷学习

本文介绍了一个完全自动且任务不可知的 CAD 生成框架 AutoCAD，该框架结合分类器解析生成对抗数据，通过不太可能的训练生成多样性的对抗，从而系统提高了不同 NLU 任务的预训练模型在多个挑战基准测试中的翻译能力。

Nov, 2022

通过主动生成成对的反事实，提高分类器的健壮性

本文提出一种利用对抗生成模型自动生成对抗样本并用成对分类器对其自动标注的框架，通过对仅 10% 人工标注的对抗样本数据进行生成，能有效提高情感分类和问题重述任务等自然语言分类器的 18-20% 稳健性和 14-21% 误差缩减。

May, 2023

探究自动生成的反事实数据在情感分析中的有效性

提出了一种自动产生对立数据的方法，基于此数据增广训练集可以有效提高 NLP 模型的性能。

Jun, 2021

通过逐个解释得出 (反事实的) 差异

通过使用无监督生成模型进行反事实数据增强，降低 MMI 方法在挑选文本方面的性能，从而更好地捕捉感兴趣的信号，并提高基于解释性自然语言处理（NLP）的合理性模型的性能。

Jan, 2022

利用反事实增强数据学习具有显著差异的因素

本文探讨了机器学习中由于混淆而导致的伪相关性问题，通过因果关系提供了明确的概念，并介绍了一种训练模型的方法和资源，可以降低其对伪相关性的敏感度，最终实验表明基于该方法提出的分类器在情感分析和自然语言推理任务上表现出了很好的性能。

Sep, 2019

解释反事实增强数据的功效

本文提出了一种基于因果模型的玩具模型，探讨了因果模型、测量噪声、跨领域泛化以及对虚假信号的依赖之间的有趣关系，并以大规模经验研究为基础，比较了用于创建 CAD 的跨度与关注区域和显著性图所选跨度之间的差异，发现对于 CAD，研究中提出的假说在许多领域和模型中都是显著的。

Oct, 2020

解释、编辑、生成：为多跳事实验证的理由敏感的反事实数据增强

论文提出了一种理性敏感的方法来生成语言多样且标签翻转的反事实数据，同时保持逻辑关系，并通过检查和过滤模块对反事实数据进行规范化，实验结果表明该方法优于基准模型，并且能够生成语言多样的反事实数据而不破坏其逻辑关系。

Oct, 2023

在现实反事实情况下连接属性和 QA 模型行为

本文研究了不同的归因技术在阅读理解（RC）领域中对现实反事实的假设的对齐程度，并发现对于 RC 最好的表现来自于我们对现有的一种配对归因方法的修改。

Apr, 2021

我们应该依赖实体提及来进行关系抽取吗？通过反事实分析消除关系抽取偏差

本文提出了一种名为 CORE 的反事实分析方法，通过构造关系提取器的因果图，并在其上进行反事实分析来捕捉和减少实体偏置。该方法不会改变现有 RE 系统的训练过程，极大地提高了 RE 的效率和概括能力。

May, 2022