MultiReQA：跨领域检索问答模型评估

May, 2020

MultiReQA：跨领域检索问答模型评估

MultiReQA: A Cross-Domain Evaluation for Retrieval Question Answering Models

Mandy Guo, Yinfei Yang, Daniel Cer, Qinlan Shen, Noah Constant

TL;DR本文介绍了一个新的多领域检索问题回答（ReQA）评估套件 MultiReQA，使用两个监督性神经模型（基于精调的 BERT 和 USE-QA 模型）及一个信息检索基线 BM25 在基于句子的 QA 数据集上进行系统评估，结果表明，虽然存在覆盖所有领域的通用模型，但通常通过对特定领域训练来获得最佳性能。

Abstract

retrieval question answering (ReQA) is the task of retrieving a sentence-level answer to a question from an open corpus (Ahmad et al.,2019).This paper presents multireqa, anew multi-domain ReQA evaluation suite c

retrieval question answering multireqa neural models bert information retrieval

发现论文，激发创造

ReQA: 面向端到端答案检索模型的评价

本篇论文介绍了一个用于评估大规模句子级别答案检索模型的基准 Retrieval Question-Answering（ReQA），并使用神经编码模型和传统信息检索技术建立了基线。我们提供我们的评估代码以鼓励更多关于这一具有挑战性的任务的研究。

Jul, 2019

多语言池中的语言无关答案检索

介绍了 LAReQA - 一项新的挑战性基准测试，可从多语言候选池中进行语言无关的答案检索。在基于多语言 BERT 的基础上，研究了实现强交叉语言对齐的不同策略，发现通过机器翻译增加训练数据是有效的，同时，该基线在 LAReQA 上表现最好，但在仅瞄准 “弱” 对齐的任务中却不及竞争基线，这突显了语言无关检索是一种实质性新型跨语言评估。

Apr, 2020

ZusammenQA：专用模型数据增强的跨语言开放检索问答系统

该论文提出了一种用于 COQA 多语言问题解答的系统，该系统使用多种模型变体在数据增强、语段检索和答案生成三个主要组件上进行了研究，并结合语言模型预训练和数据增强等方法有效提高了针对低资源语言的表现。

May, 2022

开放域问答系统综述：检索与阅读

本文综述了 OpenQA 领域的最新研究趋势，重点关注采用神经 MRC 技术的系统，介绍了现代 OpenQA 体系结构 Retriever-Reader 及采用该体系结构的各种系统，讨论了开发 OpenQA 系统面临的关键挑战，并对常用的基准进行了分析。

Jan, 2021

知识密集型任务的多任务检索

本文介绍了一个多任务学习的神经检索模型，该模型在少样本、领域内外多种问题下表现良好，能够有效地检索到相关上下文信息，并且在多个基准测试中实现了与或优于目前的最新技术结果。

Jan, 2021

多模态查询的端到端知识检索

本文介绍了一个新的数据集 ReMuQ，针对跨媒体检索的任务，提出了一个直接处理文本和图像输入的 Retriever 模型 `ReViz`，并引入了一个新的预训练任务，实现了对多模态查询的知识检索，并在两个数据集上取得了优秀的检索效果。

Jun, 2023

M2QA：多领域多语言问答

通过引入多领域多语言问题回答基准 M2QA，并利用其探索经过微调的模型、最新最先进的 LLM 的跨语言跨领域性能，以及研究模块化方法对领域和语言进行适应，我们发现模型类别内在领域 - 语言组合上具有相当大的性能差异，并且在所有模型规模上源语言 - 目标语言 / 领域组合之间存在显著的性能下降。我们证明了 M2QA 并未得到完全解决，需要新的方法来有效地传递语言和领域特定信息。

Jul, 2024

LocalRQA: 从生成数据到本地训练、测试和部署检索增强型问答系统

Retrieval-augmented question-answering systems combine retrieval techniques and large language models, while LocalRQA is an open-source toolkit that supports customizing the model training, testing, and deployment process, achieving comparable performance to OpenAI's text-ada-002 and GPT-4-turbo.

Mar, 2024

领域专属问答的检索增强生成

为 Adobe 产品建立内部问答系统，提出了一种新的框架来编译大型问答数据库并发展了基于检索感知的大型语言模型微调方法，展示了微调检索器在最终生成中带来的重大改进，降低了生成过程中的幻觉并在上下文中保留了最新的检索信息以实现情境基础。

Apr, 2024

基于知识的开放域问答

本研究提出了一种知识辅助的开放域问答方法，通过考虑问题与文档之间的关系以及文档与文档之间的关系来构建问题 - 文档图和文档 - 文档图，使用知识三元组并结合文档检索和答案重新排名来提高文档检索和答案排序的性能，从而提高了开放域问答的整体性能。

Jun, 2020