面向跨文档事件共指消解的因果关联数据增强方法

ACLApr, 2024

面向跨文档事件共指消解的因果关联数据增强方法

A Rationale-centric Counterfactual Data Augmentation Method for Cross-Document Event Coreference Resolution

Bowen Ding, Qingkai Min, Shengkun Ma, Yingjie Li, Linyi Yang...

TL;DR基于预训练语言模型（PLMs），事件共指消解（ECR）系统通过聚类跨文档的语义指示共指事件展现出了出色的性能；然而，现有系统在输入提及对中展现出对 “触发词词汇匹配” 的过度依赖；我们基于结构因果模型（SCM）对基线 ECR 系统的决策过程进行形式化，旨在识别 ECR 任务中的伪因果关联（即依据）；借助反事实数据增强的去偏方法，我们开发了一种以依据为中心的反事实数据增强方法，结合了 LLM 循环；该方法专门针对 ECR 系统的两两输入，在触发词和上下文上进行直接干预，以减少伪关联并强调因果关系；我们的方法在三个流行的跨文档 ECR 基准测试上取得了最先进的性能，并在领域外场景中展现出稳健性。

Abstract

Based on pre-trained language models (PLMs), event coreference resolution (ECR) systems have demonstrated outstanding performance in clustering coreferential events across documents. However, the existing system

pre-trained language models event coreference resolution structural causal model counterfactual data augmentation cross-document ecr benchmarks

发现论文，激发创造

基于生成的理由和知识蒸馏的事件共指建模

使用自然语言处理（NLP）中的事件核指消解（Event Coreference Resolution）技术，通过利用现代自回归语言模型生成的假设自由文本（abductive free-text rationales）作为小型学生模型的远程监督，进行事件的跨文档核指消解（cross-document coreference），以提高核指消解的性能。

Apr, 2024

基于 X-AMR 的跨文档线性事件共指消解

本研究通过引入事件图的图形化表示 X-AMR 以及使用一种新型的多跳共指算法简化了事件共指消解，从而使其成为 LLM 成本效益高、可组合和可解释的，并且易于注释，进一步使用 GPT-4 与人类进行比较评估，分析了其局限性，旨在推进有效的事件共指消解技术并揭示当前 LLM 在此任务中的潜在缺陷。

Mar, 2024

基于提示的事件共指消解：通过测量事件类型和参数的兼容性

事件指代消解的提问式模板方法（CorefPrompt）在单一模板中实现了事件建模和指代消解，并通过两个辅助任务明确展示了推理过程，提高了模型的预测能力。

Oct, 2023

多模态跨文档事件共指消解的线性语义转移和混合模态集成

提出了一种融合视觉和文本线性映射的多模态跨文档事件共指解析方法，通过对事件中心图像的集成，对核心指称进行融合模型、线性映射和集合方法进行处理，实现了对事件共指的跨模态线性映射，为核心指称解析领域提供了多模态信息的实用性和需要更多多模态资源的提示。

Apr, 2024

解释、编辑、生成：为多跳事实验证的理由敏感的反事实数据增强

论文提出了一种理性敏感的方法来生成语言多样且标签翻转的反事实数据，同时保持逻辑关系，并通过检查和过滤模块对反事实数据进行规范化，实验结果表明该方法优于基准模型，并且能够生成语言多样的反事实数据而不破坏其逻辑关系。

Oct, 2023

协同事件理解：基于大型语言模型的跨文档事件共指消解的协同方法

利用大型语言模型和小型语言模型协作的方法在跨文档事件共指解析中取得了最好的性能，并且在不同的数据集中都表现出了最先进的性能，强调了其在多样场景中的有效性。

Jun, 2024

通过逐个解释得出 (反事实的) 差异

通过使用无监督生成模型进行反事实数据增强，降低 MMI 方法在挑选文本方面的性能，从而更好地捕捉感兴趣的信号，并提高基于解释性自然语言处理（NLP）的合理性模型的性能。

Jan, 2022

$2 * n$ 更优于 $n^2$：将事件核指代消解分解为两个易处理问题

本文提出了一种新的 Event Coreference Resolution（ECR）方法，通过词形匹配、过滤和平衡训练集等步骤，实现了对跨文档和同一文档内事件提及的链接，减少了计算需求，并在两个常用 ECR 数据集上获得了与当前先进水平相当的结果。

May, 2023

跨文档指代消解的现实评估原则

该研究指出跨文档指代消解的常见评估方法在假设情境方面过于宽松，导致结果夸大。为此，提出两种评估方法论原则，一是应该根据预测的提及而非黄金提及来评估模型，二是模型不应利用合成的 ECB + 数据集的主题结构，以便模型面对词汇歧义挑战，实证结果显示我们更为真实的评估方法对于一个竞争模型的影响巨大，并导致 33 的 F1 得分下降，从而解决该问题。

Jun, 2021

LearnDA: 可学习的知识引导数据增强用于事件因果关系识别

本文介绍了一种新的事件因果识别训练数据增强方法，该方法采用双重学习框架和基于知识引导的方法生成新的句子，实验表明该方法在两个基准测试数据集上表现优于之前的方法。

Jun, 2021