QANUS:一款开源的问答平台
本论文提出了一种新型问题表示方式:模板,应用于十亿级别的知识库和百万级别的问答数据。通过学习用于特定目的的模板,系统KBQA可以有效地回答基础性问题和复杂问题,并在QALD基准测试中胜出其他工作。
Mar, 2019
本文的主要研究领域是关于自动问答,重点介绍了知识图谱、非结构化文本和混合语料库等来源的家族算法,并讨论了每个子主题中涉及的复杂性问题和系统中介绍的可解释性和互动性程度,最后总结了QA领域的最具前景的新兴趋势。
Apr, 2020
使用Wizard of Oz的方法结合众包技术,从三个Stack Exchange网站收集了2437组对话和10917个问答信息,构建了DoQA数据集,为FAQ站点中的大量领域特定信息构建了面向对话的问答(QA)界面,并介绍了更多的实际检索信息场景,取得了良好的性能。
May, 2020
本篇论文介绍了一个名为 SF-QA 的简单公平的开放领域问答(QA)评估框架,该框架模块化了管道开放领域 QA 系统,使得任务本身容易被研究小组访问和再现,从而实现了对于开放领域 QA 的评估和再现性的拓展。
Jan, 2021
介绍可能会被问到的问题(PAQ)等资源,提出一种新的QA-pair检索程序(RePAQ),为CBQA模型的训练提供了更多的知识库,并表明利用Retrieval机制的效果要优于直接从文本语料库中提取答案的方法,但需要权衡速度和准确性。
Feb, 2021
RealTime QA是一个动态的问答平台,使用GPT-3等大型预训练语言模型为基础构建了强大的基线模型,并追求及时应用,研究表明GPT-3可根据新检索到的文档适当更新其生成结果,但当检索到的文档提供不足信息时,可能会出现过时答案。
Jul, 2022
BigText-QA旨在开发一个综合QA系统,它能够回答基于一个知识图谱(KG)的更冗余形式的问题,该图谱将结构化和非结构化(即“混合”)知识组织在统一的图形表示中,既有一个命名实体的规范集合,又有提供高度多样化的关系释义和丰富上下文信息的文本子句的开放集合。
Dec, 2022
在这篇论文中,我们展示了能够为低资源语言开发有效且成本低廉的OpenQA系统的关键要素,其中包括利用机器翻译标注数据的弱监督和目标语言中相关的非结构化知识源。我们以土耳其语为挑战性案例研究,通过ColBERT-QA对SQuAD-TR进行了调整来构建我们的OpenQA系统。在使用两个跨足两年的维基百科转储版本的基础上,我们与基于BM25和DPR的QA读取器模型相比,在EM得分上获得了9-34%的性能提升以及F1得分上的13-33%的性能提升。我们希望我们的结果可以鼓励研究人员在其他低资源语言中构建OpenQA系统,并将所有的代码、模型和数据集公开提供。
Jan, 2024
SPAGHETTI是一个混合问答(QA)流水线,利用来自知识库、文本、表格和信息框的异构知识源,通过LLM增强方法在Compmix数据集上取得了最先进的性能,达到了56.5%的精确匹配(EM)率。更重要的是,对数据集的一部分进行手动分析表明,SPAGHETTI的准确率超过90%,表明EM不再适用于评估当前的QA系统的能力。
Jun, 2024