本文提出了一种基于神经网络和增强学习的新型开放领域问答系统,通过信息检索结合阅读理解模型对大规模语料库进行查询,显著提高了多个数据集的表现。
Aug, 2017
本文讲述了一种称为段落排名器的方法,它提高了开放域 QA 管道的性能,通过排名检索文档的段落以获取更高的答案回忆率和更少的噪声。在四个开放域 QA 数据集上,使用段落排名器排名段落和聚合答案相比未使用该方法,性能平均提高了 7.8%,也展示了开放域 QA 与机器理解模型的结合。
Oct, 2018
本文提出一种基于语义知识排名模型和知识融合模型的开放领域问答方法,该方法通过整合基于 Lucene 的信息检索系统检索的知识和 BERT 语言模型中的外部检索知识,以正确回答问题。研究表明,基于知识融合模型的方法优于之前的尝试。
Apr, 2020
本文综述了 OpenQA 领域的最新研究趋势,重点关注采用神经 MRC 技术的系统,介绍了现代 OpenQA 体系结构 Retriever-Reader 及采用该体系结构的各种系统,讨论了开发 OpenQA 系统面临的关键挑战,并对常用的基准进行了分析。
Jan, 2021
RankQA 是一种新的神经问答模型,利用三阶段过程(检索、理解和重新排序)来自动回答问题,为后续基于内容的问答研究提供了有力的基线模型。
Jun, 2019
本研究提出了一种基于规则的开放域问答系统,可以回答来自相关上下文的任何领域的问题,使用 1000 个问题的 SQuAD 2.0 数据集测试开发的系统表现满意,同时分析了性能。
Mar, 2022
本文提出使用维基百科作为唯一知识源来解决开放领域问题回答,提出了一种基于大二元哈希和 TF-IDF 匹配的搜索组件与训练于维基段落中检测答案的多层循环神经网络模型的结合方法,同时现有数据集的实验结果表明,这两个模块都是高度竞争力的,并且使用远程监督进行多任务学习的组合是这个具有挑战性任务的有效完整系统。
Mar, 2017
本文提出了两种新的模型,在公开领域问答数据集中取得了最具竞争力的结果。这两种方法是使用多篇文章生成答案。
Nov, 2017
本篇论文通过系统地研究检索器的预训练,提出了一种利用反向填空任务和掩盖显著跨度的无监督预训练方法,并在问题 - 上下文对上进行有监督微调的方法。此外还探讨了两种 OpenQA 模型的端对端有监督培训方法,并展示了这些方法在性能方面相对于较小模型的一致性提升。实验结果表明这些方法效果显著优于现有的一些模型。
通过对外部知识进行动态阅读的方法,结合模型参数内已有知识的‘封闭阅读’和结合‘开放阅读’的方式,有效提升了开放域问答模型的推理效率和预测准确率。
Nov, 2022