QANUS：一款开源的问答平台

Jan, 2015

QANUS: An Open-source Question-Answering Platform

Jun-Ping Ng, Min-Yen Kan

TL;DR本文介绍了一个公开可用的通用问答（QA）系统软件框架的需求，提出了一种开源QA框架QANUS，研究人员可以利用它轻松快速地构建新的QA系统。我们进一步提出了一个完全功能的基于QANUS的事实型QA系统QA-SYS来展示框架的实用性和实际性。

Abstract

In this paper, we motivate the need for a publicly available, generic software framework for question-answering (QA) systems. We present an open-

发现论文，激发创造

基于问题回答语料库和知识库的问题回答学习

本论文提出了一种新型问题表示方式：模板，应用于十亿级别的知识库和百万级别的问答数据。通过学习用于特定目的的模板，系统KBQA可以有效地回答基础性问题和复杂问题，并在QALD基准测试中胜出其他工作。

Mar, 2019

基于筛选和开放网络资源的问答系统

本文的主要研究领域是关于自动问答，重点介绍了知识图谱、非结构化文本和混合语料库等来源的家族算法，并讨论了每个子主题中涉及的复杂性问题和系统中介绍的可解释性和互动性程度，最后总结了QA领域的最具前景的新兴趋势。

Apr, 2020

通过对话问答访问特定领域的常见问题解答

使用Wizard of Oz的方法结合众包技术，从三个Stack Exchange网站收集了2437组对话和10917个问答信息，构建了DoQA数据集，为FAQ站点中的大量领域特定信息构建了面向对话的问答（QA）界面，并介绍了更多的实际检索信息场景，取得了良好的性能。

May, 2020

SF-QA: 开放域问答简单公平评估库

本篇论文介绍了一个名为 SF-QA 的简单公平的开放领域问答（QA）评估框架，该框架模块化了管道开放领域 QA 系统，使得任务本身容易被研究小组访问和再现，从而实现了对于开放领域 QA 的评估和再现性的拓展。

Jan, 2021

PAQ: 6500万可疑问题及其应用

介绍可能会被问到的问题（PAQ）等资源，提出一种新的QA-pair检索程序（RePAQ），为CBQA模型的训练提供了更多的知识库，并表明利用Retrieval机制的效果要优于直接从文本语料库中提取答案的方法，但需要权衡速度和准确性。

Feb, 2021

为开放域问答设计最小检索和阅读系统

本文提出了几种策略，大幅减少提取和阅读的开放域问答系统的存储空间占用，即使在边缘设备上使用，也可以实现比纯参数模型更好的准确度。

Apr, 2021

实时问答：现在的答案是什么？

RealTime QA是一个动态的问答平台，使用GPT-3等大型预训练语言模型为基础构建了强大的基线模型，并追求及时应用，研究表明GPT-3可根据新检索到的文档适当更新其生成结果，但当检索到的文档提供不足信息时，可能会出现过时答案。

Jul, 2022

大规模混合知识图谱上的问答系统

BigText-QA旨在开发一个综合QA系统，它能够回答基于一个知识图谱（KG）的更冗余形式的问题，该图谱将结构化和非结构化（即“混合”）知识组织在统一的图形表示中，既有一个命名实体的规范集合，又有提供高度多样化的关系释义和丰富上下文信息的文本子句的开放集合。

Dec, 2022

为低资源语言构建高效高效的OpenQA系统

在这篇论文中，我们展示了能够为低资源语言开发有效且成本低廉的OpenQA系统的关键要素，其中包括利用机器翻译标注数据的弱监督和目标语言中相关的非结构化知识源。我们以土耳其语为挑战性案例研究，通过ColBERT-QA对SQuAD-TR进行了调整来构建我们的OpenQA系统。在使用两个跨足两年的维基百科转储版本的基础上，我们与基于BM25和DPR的QA读取器模型相比，在EM得分上获得了9-34%的性能提升以及F1得分上的13-33%的性能提升。我们希望我们的结果可以鼓励研究人员在其他低资源语言中构建OpenQA系统，并将所有的代码、模型和数据集公开提供。

Jan, 2024

SPAGHETTI：异构数据源的开放领域问答——检索和语义解析

SPAGHETTI是一个混合问答(QA)流水线，利用来自知识库、文本、表格和信息框的异构知识源，通过LLM增强方法在Compmix数据集上取得了最先进的性能，达到了56.5%的精确匹配（EM）率。更重要的是，对数据集的一部分进行手动分析表明，SPAGHETTI的准确率超过90％，表明EM不再适用于评估当前的QA系统的能力。

Jun, 2024