端到端神经信息状态分类

EMNLPSep, 2021

End-to-end Neural Information Status Classification

Yufang Hou

TL;DR本文提出了基于神经网络的端到端方法，用于信息状态分类和桥式照应识别，并在 ISNotes 数据集上实现了语义级别下的最新成果。同时，该系统也在桥接照应识别方面表现出了竞争力。

Abstract

Most previous studies on information status (IS) classification and bridging anaphora recognition assume that the gold mention or syntactic tree information is given (Hou et al., 2013; Roesiger et al., 2018; Hou, 2020; Yu and Poesio, 2020). In this paper, we propose an end-to-end neural appro

information status classification bridging anaphora recognition neural approach isnotes corpus end-to-end system

发现论文，激发创造

利用话语上下文感知 BERT 进行细粒度信息状态分类

本研究提出了基于较简单的篇章语境感知 BERT 模型的信息状态分类方法，无需复杂的手工制作语义特征即可在识别回指时达到更高的准确性，并在 ISNotes 语料库上获得了最先进的分类效果。

Oct, 2020

无需标记级监督的端到端信息提取

本文提出了一种基于指针网络的端到端模型，可以在不需要 token 级标签的情况下直接从原始文本和输出文本对中训练模型，该模型在 ATIS 数据集、MIT 餐厅语料库和 MIT 电影语料库上进行了评估，并与使用 token 级标签的神经基线进行了比较，取得了与基线几乎相同的竞争结果，证明了在不需要 token 级标签的情况下实现端到端信息提取的可行性。

Jul, 2017

将指代消解作为问答的桥梁

该研究将连贯指代消解视为基于上下文的问答，并提出了一个名为 BARQA 的框架来处理此任务，利用迁移学习的能力使模型在 ISNotes 和 BASHI 两个连贯语料库上的表现达到了最新的最佳水平。

Apr, 2020

基于结构化信息的语音中断检测的跨度分类

本文提出了一种新颖的检测漫游症的体系结构，结合了上下文信息和依存树捕获的长距离结构化信息，在英文 Switchboard 上实现了最先进的结果，明显优于现有技术。

Mar, 2022

文档级信息抽取自动错误分析

本研究提出通过基于转换的框架实现文档级事件和关系提取自动化错误分析，进而比较两种最先进的模板填充方法在三个领域的数据集上的表现，并对信息提取领域自其 30 年前创始以来的发展进行了评估。

Sep, 2022

远程监督的词形句法模型用于关系抽取

信息抽取任务涉及将非结构化文本内容自动转换为结构化数据。本文提出了一种从文本中提取和分类无限制关系集的方法，它基于远程监督方法获取的形态 - 句法抽取模式，并创建句法和语义索引来提取和分类候选图。我们在构建在 Wikidata 和 Wikipedia 上的六个数据集上评估了我们的方法。评估结果显示，我们的方法可以实现高达 0.85 的精确度得分，但召回率和 F1 得分较低。我们的方法可以快速构建基于规则的信息抽取系统，并构建注释数据集以训练基于机器学习和深度学习的分类器。

Jan, 2024

通过生成和压缩信息进行基于跨度的命名实体识别

本文提出将生成模型和信息压缩模型结合在一起，通过信息瓶颈模型提高命名实体识别（NER）性能。通过实验证明，联合训练生成模型和信息压缩模型可以增强基线的基于 span 的 NER 系统的性能。

Feb, 2023

用于联合基于跨度的方面 - 情感分析的分层交互网络

本文提出了一种层次交互网络（HI-ASA）来建模任务间的双向交互，利用交叉针织机制选择性地组合不同的任务特定特征，以确保适当的双向交互，然后应用相互信息技术在输出层互相约束学习，从而使方面输入和情感输入能够通过反向传播编码另一个任务的特征。

Aug, 2022

基于多任务学习的神经桥接参考解析

我们提出了一种基于多任务学习的神经模型，用于解决桥接参照的问题，解决了缺乏大型标注数据集和不同语料库之间定义不同的挑战，通过使用多任务学习和语料库无关特征实现了很高的性能。

Mar, 2020

基于动态跨度图的信息抽取通用框架

介绍了一个通用的框架，用于多个信息提取任务，共享动态构建的跨度图表示，该图由选择最可靠的实体跨度所构成，并使用置信度加权关系类型和共参考建立节点，从而实现共参考和关系类型置信度通过图传播迭代地细化跨度表示，与以前的多任务信息提取框架不同，我们的框架显著优于多个数据集上的多个信息提取任务的最新水平，涵盖了不同的领域。另外，我们观察到跨度枚举方法在检测嵌套跨距实体方面表现出色，在 ACE 数据集上 F1 分数显著提高。

Apr, 2019