该研究提出了两个神经网络排序器,用于评分不同段落是否包含特定问题的答案,进一步分析了语义相似性与单词级相关性匹配在开放域QA中的相对重要性。
Apr, 2018
该论文介绍了一种新的开放域问答框架,其中检索器和阅读器相互迭代交互,引入了多步推理机制,有助于从长度为百万级的语料库中检索信息性段落,并应用于不同的问答数据集和模型中均取得了一致性的提升。
May, 2019
利用 ColBERT 模型定义了 ColBERT-QA,采用细粒度相互作用和弱监督策略来提升开放域问答的效果,实验结果表明在三个数据集上均取得了最先进的提取式开放域问答性能。
Jul, 2020
本文研究了一种混合的提取式和生成式阅读器方法,以及如何结合这两种方法进行问答。我们通过一些新技术对预训练的神经语言模型进行了改进,证明了这种方法比以前最先进的模型效果更好,取得了3.3和2.7的提升。
Jan, 2021
本篇论文通过系统地研究检索器的预训练,提出了一种利用反向填空任务和掩盖显著跨度的无监督预训练方法,并在问题-上下文对上进行有监督微调的方法。此外还探讨了两种OpenQA模型的端对端有监督培训方法,并展示了这些方法在性能方面相对于较小模型的一致性提升。实验结果表明这些方法效果显著优于现有的一些模型。
本文提出了一种用于对话式问答的多方面改进框架,通过KL散度正则化、后处理程序和课程学习策略等三个方面的改进,有效地解决了开放域问答过程中的一系列问题,并在公开数据集OR-QuAC上展现了比同类模型更好的性能表现。
Apr, 2022
本研究介绍了开放域问题回答(ODQA)的效率,并提供了最新的研究成果和挑战,以期为ODQA效率的进一步发展做出贡献。
Nov, 2022
通过研究状况下的密集通道检索(DPR)检索器和解码中的融合(FiD)阅读器的流程,我们提出和评估了强大而简单高效的基准线,通过在检索器和阅读器之间引入快速重新排列组件并执行有针对性的微调步骤,改进了现有方法的性能,并减少了阅读器的延迟60%。
Oct, 2023
本研究通过对52个数据集和20种评估技术进行综述,详细研究了当前开放域问题回答领域的现状,提出了一种包含问题类型的多模态数据集新分类法,并对评估指标进行结构化整理和批判性分析,旨在为现代问答系统的强大评估提供框架,并指出了当前的挑战和未来研究发展的有希望的方向。
Jun, 2024
本研究解决了开放域问答(ODQA)中推理效率低的问题,提出了一种新颖的句子选择方法(FastFiD),在保留关键信息的同时减少了生成答案所需的上下文长度。实验结果表明,该方法在保持模型性能的情况下,推理速度提升了2.3至5.7倍,具有显著的影响潜力。
Aug, 2024