Visconde: 使用 GPT-3 和神经重排序的多文档问答

Dec, 2022

Visconde: 使用 GPT-3 和神经重排序的多文档问答

Visconde: Multi-document QA with GPT-3 and Neural Reranking

Jayr Pereira, Robson Fidalgo, Roberto Lotufo, Rodrigo Nogueira

TL;DR本文提出了一个名为 Visconde 的问答系统，利用 few-shot 大型语言模型和先进的搜索引擎检索多个文档中的支持证据用于回答问题，评估结果表明检索机制是主要的瓶颈，为了得到更好的回答表现，模型在回答问题前给出解释是有效的。

Abstract

This paper proposes a question-answering system that can answer questions whose supporting evidence is spread over multiple (potentially long) documents. The system, called Visconde, uses a three-step pipeline to perform the task: →

question-answering decompose retrieval few-shot search engine

发现论文，激发创造

检索，阅读，重新排名：面向端到端多文档阅读理解

本文提出了 RE$^3$QA，一种统一的问答模型，它结合了上下文检索、阅读理解和答案重排序来预测最终答案。与以往的流水线方法不同，RE$^3$QA 跨不同的组件共享上下文化的文本表示，并设计了高质量的上游输出来直接监督下游模块，从而避免了上下文不一致的问题，实现了端到端的训练。实验证明，我们的模型优于管道基线，在两个版本的 TriviaQA 和两个变体的 SQuAD 上实现了最先进的结果。

Jun, 2019

长篇文档的分层问答

基于强化学习和词向量，提出了一种可以高效处理长篇文档的问答框架，该框架结合了快速筛选相关句子和精读相关句子的策略，并在 Wikireading 的一个挑战性子集和一组新的数据集上实现了最新的性能，同时使模型的速度提高 3.5 倍至 6.7 倍。

Nov, 2016

多篇文档阅读理解的深度级联模型

本研究提出一种深度串级学习模型来平衡在线问答系统的效能和效率之间的基本权衡，在多文档的 MRC 场景中取得更好的效果并能够在不到 50 毫秒内稳定地为数百万日请求提供服务。

Nov, 2018

一种灵活框架的零样本文档级问答检测、检索和理解

本文提出了一种三阶段文件 QA 方法，包括从 PDF 中提取文本，从提取的文本中检索证据以形成良好的上下文，以及从上下文中提取 3 种类型的知识（抽取式、生成式或布尔式）。通过对 QASPER 的评估，DRC 系统在交付更优的上下文选择的同时，Answer-F1 达到了 +7.19 的提高。结果表明，DRC 在科学文献 QA 中有很大的亮点。

Oct, 2022

Jaeger：一种基于串联的多 Transformer VQA 模型

本文介绍了 Jaegar，一种基于连接的多转换器 VQA 模型，用于解决基于文档的视觉问答中的挑战。该模型利用 RoBERTa large 和 GPT2-xl 作为特征提取器，并通过将两个模型的输出进行连接来加强其表示能力，以减少计算复杂性和推理时间。实证结果表明，该模型在 PDF-VQA 数据集的 C 任务上具有竞争力的性能。

Oct, 2023

基于知识引导的开放领域问答中的文本检索和阅读

本研究提出了一种基于知识库和相关文章文本联合的开放领域问答方法，通过检索和阅读一个包含文本段的图表结构，并采用跨相关段落传播信息的方式更新文本段落表示，从而在 WebQuestions、自然问题和 TriviaQA 三个任务的数据集上实现了 2-11% 的性能提升。

Nov, 2019

用图引导的多轮检索方法解决面向对话的开放领域问答

本文提出了一种基于图模型和关联反馈的检索方法，用于连续的问答交互中提高检索效率和准确性。实验结果显示，与当前流行的方法相比，该方法大幅提高了问题回答的 F1 得分。

Apr, 2021

可扩展开放领域问答的多步检索器和阅读器交互

该论文介绍了一种新的开放域问答框架，其中检索器和阅读器相互迭代交互，引入了多步推理机制，有助于从长度为百万级的语料库中检索信息性段落，并应用于不同的问答数据集和模型中均取得了一致性的提升。

May, 2019

开放域问答中的答案重新排序的证据聚合

本文提出了两种新的模型，在公开领域问答数据集中取得了最具竞争力的结果。这两种方法是使用多篇文章生成答案。

Nov, 2017

R$^3$: 强化学习阅读器 - 排名器用于开放领域问答

本文提出了一种基于神经网络和增强学习的新型开放领域问答系统，通过信息检索结合阅读理解模型对大规模语料库进行查询，显著提高了多个数据集的表现。

Aug, 2017