Visconde: 使用 GPT-3 和神经重排序的多文档问答
本文提出了 RE$^3$QA,一种统一的问答模型,它结合了上下文检索、阅读理解和答案重排序来预测最终答案。与以往的流水线方法不同,RE$^3$QA 跨不同的组件共享上下文化的文本表示,并设计了高质量的上游输出来直接监督下游模块,从而避免了上下文不一致的问题,实现了端到端的训练。实验证明,我们的模型优于管道基线,在两个版本的 TriviaQA 和两个变体的 SQuAD 上实现了最先进的结果。
Jun, 2019
基于强化学习和词向量,提出了一种可以高效处理长篇文档的问答框架,该框架结合了快速筛选相关句子和精读相关句子的策略,并在 Wikireading 的一个挑战性子集和一组新的数据集上实现了最新的性能,同时使模型的速度提高 3.5 倍至 6.7 倍。
Nov, 2016
本研究提出一种深度串级学习模型来平衡在线问答系统的效能和效率之间的基本权衡,在多文档的 MRC 场景中取得更好的效果并能够在不到 50 毫秒内稳定地为数百万日请求提供服务。
Nov, 2018
本文提出了一种三阶段文件 QA 方法,包括从 PDF 中提取文本,从提取的文本中检索证据以形成良好的上下文,以及从上下文中提取 3 种类型的知识(抽取式、生成式或布尔式)。通过对 QASPER 的评估,DRC 系统在交付更优的上下文选择的同时,Answer-F1 达到了 +7.19 的提高。结果表明,DRC 在科学文献 QA 中有很大的亮点。
Oct, 2022
本文介绍了 Jaegar,一种基于连接的多转换器 VQA 模型,用于解决基于文档的视觉问答中的挑战。该模型利用 RoBERTa large 和 GPT2-xl 作为特征提取器,并通过将两个模型的输出进行连接来加强其表示能力,以减少计算复杂性和推理时间。实证结果表明,该模型在 PDF-VQA 数据集的 C 任务上具有竞争力的性能。
Oct, 2023
本研究提出了一种基于知识库和相关文章文本联合的开放领域问答方法,通过检索和阅读一个包含文本段的图表结构,并采用跨相关段落传播信息的方式更新文本段落表示,从而在 WebQuestions、自然问题和 TriviaQA 三个任务的数据集上实现了 2-11% 的性能提升。
Nov, 2019
本文提出了一种基于图模型和关联反馈的检索方法,用于连续的问答交互中提高检索效率和准确性。实验结果显示,与当前流行的方法相比,该方法大幅提高了问题回答的 F1 得分。
Apr, 2021
该论文介绍了一种新的开放域问答框架,其中检索器和阅读器相互迭代交互,引入了多步推理机制,有助于从长度为百万级的语料库中检索信息性段落,并应用于不同的问答数据集和模型中均取得了一致性的提升。
May, 2019
本文提出了一种基于神经网络和增强学习的新型开放领域问答系统,通过信息检索结合阅读理解模型对大规模语料库进行查询,显著提高了多个数据集的表现。
Aug, 2017