关系分类生成对抗样本的自动化方法
通过增加具有相反特性和标签的反事实数据来训练鲁棒的文本分类器,以强化模型可靠性和泛化性,实验证明,其在人工生成对照样本和原始测试数据上表现出较高的鲁棒性和精准度。
Dec, 2020
本文介绍了一个完全自动且任务不可知的 CAD 生成框架 AutoCAD,该框架结合分类器解析生成对抗数据,通过不太可能的训练生成多样性的对抗,从而系统提高了不同 NLU 任务的预训练模型在多个挑战基准测试中的翻译能力。
Nov, 2022
本文提出一种利用对抗生成模型自动生成对抗样本并用成对分类器对其自动标注的框架,通过对仅 10% 人工标注的对抗样本数据进行生成,能有效提高情感分类和问题重述任务等自然语言分类器的 18-20% 稳健性和 14-21% 误差缩减。
May, 2023
通过使用无监督生成模型进行反事实数据增强,降低 MMI 方法在挑选文本方面的性能,从而更好地捕捉感兴趣的信号,并提高基于解释性自然语言处理(NLP)的合理性模型的性能。
Jan, 2022
本文探讨了机器学习中由于混淆而导致的伪相关性问题,通过因果关系提供了明确的概念,并介绍了一种训练模型的方法和资源,可以降低其对伪相关性的敏感度,最终实验表明基于该方法提出的分类器在情感分析和自然语言推理任务上表现出了很好的性能。
Sep, 2019
本文提出了一种基于因果模型的玩具模型,探讨了因果模型、测量噪声、跨领域泛化以及对虚假信号的依赖之间的有趣关系,并以大规模经验研究为基础,比较了用于创建 CAD 的跨度与关注区域和显著性图所选跨度之间的差异,发现对于 CAD,研究中提出的假说在许多领域和模型中都是显著的。
Oct, 2020
论文提出了一种理性敏感的方法来生成语言多样且标签翻转的反事实数据,同时保持逻辑关系,并通过检查和过滤模块对反事实数据进行规范化,实验结果表明该方法优于基准模型,并且能够生成语言多样的反事实数据而不破坏其逻辑关系。
Oct, 2023
本文研究了不同的归因技术在阅读理解(RC)领域中对现实反事实的假设的对齐程度,并发现对于 RC 最好的表现来自于我们对现有的一种配对归因方法的修改。
Apr, 2021
本文提出了一种名为 CORE 的反事实分析方法,通过构造关系提取器的因果图,并在其上进行反事实分析来捕捉和减少实体偏置。该方法不会改变现有 RE 系统的训练过程,极大地提高了 RE 的效率和概括能力。
May, 2022