从定义理解入手进行机器阅读理解测试

ACLMay, 2020

从定义理解入手进行机器阅读理解测试

To Test Machine Comprehension, Start by Defining Comprehension

Jesse Dunietz, Gregory Burnham, Akash Bharadwaj, Owen Rambow, Jennifer Chu-Carroll...

TL;DR该研究确定机器阅读理解的内容，并提出短篇故事的一个理解模板，表明现有系统未达到我们定义的故事理解的任务水平。

Abstract

Many tasks aim to measure machine reading comprehension (MRC), often focusing on question types presumed to be difficult. Rarely, however, do task designers start by considering what systems should in fact comprehend. In this paper we make two key contributions. First, we argue that ex

machine reading comprehension content comprehension template of understanding short narratives narrative understanding

发现论文，激发创造

机器阅读理解的基准评测：心理学视角

该论文提出了基于心理学和心理测量学的 MRC 数据集设计理论基础，要求未来的数据集应该评估模型构建上下文相关情境的合理和连贯的表示能力，并通过防止捷径的问题和解释来确保实质性有效性。

Apr, 2020

机器阅读理解：文献综述

本文总结了机器阅读理解的最新进展，在语料库和技术两个方面进行了重点介绍和比较，详细描述了不同 MRC 语料库的特点以及一些典型 MRC 技术的主要思想。

Jun, 2019

教模型在理解文档后回答问题

提出了一种两阶段知识蒸馏方法，通过将 MRC 任务分为两个单独阶段教导模型更好地理解文档，实验结果表明，使用该方法装备的学生模型具有显著的改进，证明了该方法的有效性。

Jul, 2023

机器阅读理解系统调查

本文对 2016 年到 2020 年间关于机器阅读理解方面的 241 篇论文进行了全面的调查，探讨了机器阅读理解的不同方面，包括方法、结构、输入 / 输出和研究的创新之处，并论述了研究的重点发生了变化，从答案提取到答案生成，从单一到多文档阅读理解，从零开始学习到使用预训练的嵌入。同时我们还讨论了这个领域中的流行数据集和评估指标，最后还研究了最常被引用的论文及其贡献。

Jan, 2020

机器叙事阅读理解评估调查

该论文提出基于故事理论和阅读理解理论以及现有的机器故事阅读理解任务和数据集的分类方法，分析了评估任务之间的主要相似性和差异，并讨论了分类对新任务设计以及故事理解挑战的影响。

Apr, 2022

机器阅读理解可解释性调查

本文系统评述了机器阅读理解中可解释性的基准和方法，并介绍了该领域中表示和推理挑战的演变以及解决这些挑战所采取的步骤。同时，我们还提出了评估解释性系统性能的方法，并确定了存在的开放性研究问题和未来工作的关键方向。

Oct, 2020

机器阅读理解 Gold 标准评估框架

本论文提出了一个统一框架来系统研究现有的语言特征、推理需求、背景知识和事实正确性以及词汇线索的存在。研究结果发现 MRC 数据存在词汇歧义、答案事实正确性的差异和词汇线索的存在，这些都可能降低阅读理解的复杂性和质量。

Mar, 2020

机器阅读理解：任务、评价指标和基准数据集综述

本篇论文主要对机器阅读理解（MRC）领域中的任务、数据集、评估指标等方面进行综合调研和分析，发现现有 MRC 模型虽已超越人类在不同 benchmark 数据集的表现，但与真实的人类阅读理解能力仍存在很大差距，因此提出了一些未来的研究方向和关键问题。

Jun, 2020

使用组合性解释来教授机器理解

本文提出了一种使用少量半结构化解释 “教” 机器阅读理解的方法，同时提取结构化变量和规则，并组成神经模块作为下游 MRC 模型的训练实例的注释，使用可学习的神经模块和软逻辑来处理语言变化并克服模型覆盖率不足。在 SQuAD 数据集上，使用 26 个解释进行监督训练，该方法实现了 70.14% 的 F1 得分，与使用 1100 个标记实例的普通监督学习相比，速度提高了 12 倍。

May, 2020

教授机器阅读和理解

本篇论文提出了一种新方法，通过大规模监督学习从而提供阅读理解的数据集，开发了一类基于注意力机制的深度神经网络，使其能够在没有先前语言结构知识的情况下阅读真实文档并回答复杂问题。

Jun, 2015