开放域问答系统综述：检索与阅读

Jan, 2021

开放域问答系统综述：检索与阅读

Retrieving and Reading: A Comprehensive Survey on Open-domain Question Answering

Fengbin Zhu, Wenqiang Lei, Chao Wang, Jianming Zheng, Soujanya Poria...

TL;DR本文综述了OpenQA领域的最新研究趋势，重点关注采用神经MRC技术的系统，介绍了现代OpenQA体系结构Retriever-Reader及采用该体系结构的各种系统，讨论了开发OpenQA系统面临的关键挑战，并对常用的基准进行了分析。

Abstract

open-domain question answering (OpenQA) is an important task in natural language processing (NLP), which aims to answer a question in the form of natural language based on large-scale unstructured documents. Rece

发现论文，激发创造

训练用于开放域问答的排名函数

该研究提出了两个神经网络排序器，用于评分不同段落是否包含特定问题的答案，进一步分析了语义相似性与单词级相关性匹配在开放域QA中的相对重要性。

Apr, 2018

可扩展开放领域问答的多步检索器和阅读器交互

该论文介绍了一种新的开放域问答框架，其中检索器和阅读器相互迭代交互，引入了多步推理机制，有助于从长度为百万级的语料库中检索信息性段落，并应用于不同的问答数据集和模型中均取得了一致性的提升。

May, 2019

使用ColBERT进行开放式问题回答的相关性引导监督

利用 ColBERT 模型定义了 ColBERT-QA，采用细粒度相互作用和弱监督策略来提升开放域问答的效果，实验结果表明在三个数据集上均取得了最先进的提取式开放域问答性能。

Jul, 2020

UnitedQA: 开放领域问答的混合方法

本文研究了一种混合的提取式和生成式阅读器方法，以及如何结合这两种方法进行问答。我们通过一些新技术对预训练的神经语言模型进行了改进，证明了这种方法比以前最先进的模型效果更好，取得了3.3和2.7的提升。

Jan, 2021

端到端的神经检索器训练，用于开放领域的问答

本篇论文通过系统地研究检索器的预训练，提出了一种利用反向填空任务和掩盖显著跨度的无监督预训练方法，并在问题-上下文对上进行有监督微调的方法。此外还探讨了两种OpenQA模型的端对端有监督培训方法，并展示了这些方法在性能方面相对于较小模型的一致性提升。实验结果表明这些方法效果显著优于现有的一些模型。

Jan, 2021

对话式通用问题解答的多方面改进

本文提出了一种用于对话式问答的多方面改进框架，通过KL散度正则化、后处理程序和课程学习策略等三个方面的改进，有效地解决了开放域问答过程中的一系列问题，并在公开数据集OR-QuAC上展现了比同类模型更好的性能表现。

Apr, 2022

高效开放域问答测量调查

本研究介绍了开放域问题回答（ODQA）的效率，并提供了最新的研究成果和挑战，以期为ODQA效率的进一步发展做出贡献。

Nov, 2022

开放领域的会话问答的强大且高效的基线模型

通过研究状况下的密集通道检索（DPR）检索器和解码中的融合（FiD）阅读器的流程，我们提出和评估了强大而简单高效的基准线，通过在检索器和阅读器之间引入快速重新排列组件并执行有针对性的微调步骤，改进了现有方法的性能，并减少了阅读器的延迟60%。

Oct, 2023

朝向稳健评估：大语言模型时代开放领域问答数据集和度量的综合分类

本研究通过对52个数据集和20种评估技术进行综述，详细研究了当前开放域问题回答领域的现状，提出了一种包含问题类型的多模态数据集新分类法，并对评估指标进行结构化整理和批判性分析，旨在为现代问答系统的强大评估提供框架，并指出了当前的挑战和未来研究发展的有希望的方向。

Jun, 2024

FastFiD：通过句子选择提高开放域问答的推理效率

本研究解决了开放域问答（ODQA）中推理效率低的问题，提出了一种新颖的句子选择方法（FastFiD），在保留关键信息的同时减少了生成答案所需的上下文长度。实验结果表明，该方法在保持模型性能的情况下，推理速度提升了2.3至5.7倍，具有显著的影响潜力。

Aug, 2024