面向机器阅读理解的证据句子提取

Feb, 2019

面向机器阅读理解的证据句子提取

Evidence Sentence Extraction for Machine Reading Comprehension

Hai Wang, Dian Yu, Kai Sun, Jianshu Chen, Dong Yu...

TL;DR本研究提出一种利用深度概率逻辑学习框架提取证据句子的方法，在三个具有挑战性的多项选择机器阅读理解数据集上实现了可比较或更好的性能，为多项选择机器阅读理解提供了新的思路。

Abstract

Remarkable success has been achieved in the last few years on some limited machine reading comprehension (MRC) tasks. However, it is still difficult to interpret the predictions of existing MRC models. In this paper, we focus on extracting →

machine reading comprehension multiple-choice evidence sentences deep probabilistic logic learning mrc datasets

发现论文，激发创造

多项选择阅读理解的多层次证据推理

提出了一个新颖的通用模型增强方法，称为多粒度证据推断器（Mugen），该方法能够综合地提取粗粒度、中粒度和细粒度的证据，并将证据与原始文章整合，从而在四个多选 MRC 基准测试中实现了显著且一致的性能改进。

Oct, 2023

一种软证据抽取的机器阅读理解自训练方法

本研究提出了一种名为自学习方法的新技术，通过自动生成的证据标签迭代地监督证据提取器，从而提高了现有机器阅读理解模型的性能

May, 2020

U3E: 无监督和擦除基础证据提取用于机器阅读理解

本研究提出一种无监督证据抽取方法 U3E，它利用文本中句子级特征擦除的变化作为输入，模拟人类记忆衰退造成的问题解决能力下降。通过比较实验结果表明，U3E 不仅可以更准确地抽取证据，而且还可以显著改善模型性能。

Oct, 2022

教模型在理解文档后回答问题

提出了一种两阶段知识蒸馏方法，通过将 MRC 任务分为两个单独阶段教导模型更好地理解文档，实验结果表明，使用该方法装备的学生模型具有显著的改进，证明了该方法的有效性。

Jul, 2023

使用组合性解释来教授机器理解

本文提出了一种使用少量半结构化解释 “教” 机器阅读理解的方法，同时提取结构化变量和规则，并组成神经模块作为下游 MRC 模型的训练实例的注释，使用可学习的神经模块和软逻辑来处理语言变化并克服模型覆盖率不足。在 SQuAD 数据集上，使用 26 个解释进行监督训练，该方法实现了 70.14% 的 F1 得分，与使用 1100 个标记实例的普通监督学习相比，速度提高了 12 倍。

May, 2020

通过句子简化改进零样本事件提取

本文提出一种通用方法，在 MRC 模型的指导下执行无监督的句子简化，以改善 MRC-based 事件提取的性能，并在 ICEWS 地缘政治事件提取数据集上进行评估，特别关注 'Actor' 和 'Target' 参数角色，结果显示上下文简化可以提高演员提取 5% 以上和目标提取 10% 以上的性能。

Apr, 2022

利用多任务学习将关系知识纳入常识阅读理解

本文提出了一种将外部关联知识与多任务学习相结合的方法，以提高机器阅读理解的效果，并在两个多选基准数据集上进行了实验，结果表明该方法在常识推理方面表现优异。

Aug, 2019

通过基于检索的预训练弥合语言模型与机器阅读理解之间的鸿沟

使用自我监督的方法在预训练过程中引入两个任务强化证据提取，从而增强证据提取能力，以提高 Pre-trained Language Models 在机器阅读理解方面的表现。

May, 2021

多篇文档阅读理解的深度级联模型

本研究提出一种深度串级学习模型来平衡在线问答系统的效能和效率之间的基本权衡，在多文档的 MRC 场景中取得更好的效果并能够在不到 50 毫秒内稳定地为数百万日请求提供服务。

Nov, 2018

知识赋能的中文医学阅读理解表征学习：任务、模型和资源

本论文介绍了一个多目标的医疗领域机器阅读理解任务，同时提出了一个高质量的医学数据集 CMedMRC，并提出了一种医疗 BERT 模型 CMedBERT，这种模型通过异构特征的动态融合和多任务学习策略将医学知识融入到预训练的语言模型中，实验表明 CMedBERT 通过融合上下文感知和知识感知的令牌表示，始终优于强基线。

Aug, 2020