本文综述了深度学习在机器阅读理解 (MRC) 中的应用,包括典型的 MRC 任务、神经网络 MRC 的体系结构和新兴领域。文章指出了未来需要解决的问题。
Jul, 2019
该论文提出了基于心理学和心理测量学的 MRC 数据集设计理论基础,要求未来的数据集应该评估模型构建上下文相关情境的合理和连贯的表示能力,并通过防止捷径的问题和解释来确保实质性有效性。
Apr, 2020
提出了一种两阶段知识蒸馏方法,通过将 MRC 任务分为两个单独阶段教导模型更好地理解文档,实验结果表明,使用该方法装备的学生模型具有显著的改进,证明了该方法的有效性。
Jul, 2023
本篇综述论文全面比较了机器阅读理解的研究,主要介绍了它的起源、发展历程、对 NLP 社区的影响、定义、数据集、技术方法、研究亮点,并提出了新的分类和分类法,认为机器阅读理解将浅层文本匹配转化为认知推理的领域,同时也深化了从语言处理到语言理解的进展。
May, 2020
本文综述了近期在对话机器理解方面最常见的趋势和方法,强调了处理对话历史的不同方法,并提供了一个综合框架,以指导未来对于 Conversational Machine Comprehension 的研究。
Jun, 2020
本篇论文主要对机器阅读理解(MRC)领域中的任务、数据集、评估指标等方面进行综合调研和分析,发现现有 MRC 模型虽已超越人类在不同 benchmark 数据集的表现,但与真实的人类阅读理解能力仍存在很大差距,因此提出了一些未来的研究方向和关键问题。
本文对 2016 年到 2020 年间关于机器阅读理解方面的 241 篇论文进行了全面的调查,探讨了机器阅读理解的不同方面,包括方法、结构、输入 / 输出和研究的创新之处,并论述了研究的重点发生了变化,从答案提取到答案生成,从单一到多文档阅读理解,从零开始学习到使用预训练的嵌入。同时我们还讨论了这个领域中的流行数据集和评估指标,最后还研究了最常被引用的论文及其贡献。
Jan, 2020
该研究确定机器阅读理解的内容,并提出短篇故事的一个理解模板,表明现有系统未达到我们定义的故事理解的任务水平。
本论文提出了一个统一框架来系统研究现有的语言特征、推理需求、背景知识和事实正确性以及词汇线索的存在。研究结果发现 MRC 数据存在词汇歧义、答案事实正确性的差异和词汇线索的存在,这些都可能降低阅读理解的复杂性和质量。
Mar, 2020
本文系统评述了机器阅读理解中可解释性的基准和方法,并介绍了该领域中表示和推理挑战的演变以及解决这些挑战所采取的步骤。同时,我们还提出了评估解释性系统性能的方法,并确定了存在的开放性研究问题和未来工作的关键方向。
Oct, 2020