端到端神经信息状态分类
本研究提出了基于较简单的篇章语境感知 BERT 模型的信息状态分类方法,无需复杂的手工制作语义特征即可在识别回指时达到更高的准确性,并在 ISNotes 语料库上获得了最先进的分类效果。
Oct, 2020
本文提出了一种基于指针网络的端到端模型,可以在不需要 token 级标签的情况下直接从原始文本和输出文本对中训练模型,该模型在 ATIS 数据集、MIT 餐厅语料库和 MIT 电影语料库上进行了评估,并与使用 token 级标签的神经基线进行了比较,取得了与基线几乎相同的竞争结果,证明了在不需要 token 级标签的情况下实现端到端信息提取的可行性。
Jul, 2017
该研究将连贯指代消解视为基于上下文的问答,并提出了一个名为 BARQA 的框架来处理此任务,利用迁移学习的能力使模型在 ISNotes 和 BASHI 两个连贯语料库上的表现达到了最新的最佳水平。
Apr, 2020
本文提出了一种新颖的检测漫游症的体系结构,结合了上下文信息和依存树捕获的长距离结构化信息,在英文 Switchboard 上实现了最先进的结果,明显优于现有技术。
Mar, 2022
本研究提出通过基于转换的框架实现文档级事件和关系提取自动化错误分析,进而比较两种最先进的模板填充方法在三个领域的数据集上的表现,并对信息提取领域自其 30 年前创始以来的发展进行了评估。
Sep, 2022
信息抽取任务涉及将非结构化文本内容自动转换为结构化数据。本文提出了一种从文本中提取和分类无限制关系集的方法,它基于远程监督方法获取的形态 - 句法抽取模式,并创建句法和语义索引来提取和分类候选图。我们在构建在 Wikidata 和 Wikipedia 上的六个数据集上评估了我们的方法。评估结果显示,我们的方法可以实现高达 0.85 的精确度得分,但召回率和 F1 得分较低。我们的方法可以快速构建基于规则的信息抽取系统,并构建注释数据集以训练基于机器学习和深度学习的分类器。
Jan, 2024
本文提出将生成模型和信息压缩模型结合在一起,通过信息瓶颈模型提高命名实体识别(NER)性能。通过实验证明,联合训练生成模型和信息压缩模型可以增强基线的基于 span 的 NER 系统的性能。
Feb, 2023
本文提出了一种层次交互网络(HI-ASA)来建模任务间的双向交互,利用交叉针织机制选择性地组合不同的任务特定特征,以确保适当的双向交互,然后应用相互信息技术在输出层互相约束学习,从而使方面输入和情感输入能够通过反向传播编码另一个任务的特征。
Aug, 2022
我们提出了一种基于多任务学习的神经模型,用于解决桥接参照的问题,解决了缺乏大型标注数据集和不同语料库之间定义不同的挑战,通过使用多任务学习和语料库无关特征实现了很高的性能。
Mar, 2020
介绍了一个通用的框架,用于多个信息提取任务,共享动态构建的跨度图表示,该图由选择最可靠的实体跨度所构成,并使用置信度加权关系类型和共参考建立节点,从而实现共参考和关系类型置信度通过图传播迭代地细化跨度表示,与以前的多任务信息提取框架不同,我们的框架显著优于多个数据集上的多个信息提取任务的最新水平,涵盖了不同的领域。另外,我们观察到跨度枚举方法在检测嵌套跨距实体方面表现出色,在 ACE 数据集上 F1 分数显著提高。
Apr, 2019