Katecheo: 多主题问答的可移植模块化系统
本文比较了六个知识库问答系统在八个基准数据集上的表现,研究了各种问题类型、属性、语言和领域,提出了一个高级的映射算法来帮助现有模型取得更好的结果,并开发了一个 COVID-KGQA 的多语言语料库来鼓励 COVID-19 研究和多语言多样性的未来 AI,此外还讨论了主要发现及其影响、性能指南和一些未来改进。
Nov, 2022
本文提出了 KGQAn,一个通用的 QA 系统,它不需要为每个目标 KG 进行定制,而是采用一种新颖的形式化方法将问题理解为一个文本生成问题,并通过神经序列到序列模型将问题转换为中间抽象表示。我们还开发了一个即时链接器,在查询时间使用 RDF 存储的公共可访问 API 和现有索引将抽象表示映射到特定 KG 的 SPARQL 查询,而无需任何预处理。我们在几个真实的 KG 上进行的实验表明,KGQAn 易于部署,对于任意的 KG 表现良好,优于现有的 QA 系统。
Mar, 2023
DeepKE 是一款开源的知识提取工具,支持复杂的低资源、文档级别和多模态场景。它实现了各种信息提取任务,包括命名实体识别、关系提取和属性提取。
Jan, 2022
基于知识库的问答(KBQA)旨在根据知识库来回答事实性问题。本研究针对无人系统中的知识图推理问答的 CCKS2023 竞赛,在 ChatGPT 和 GPT-3 等大型语言模型在许多问答任务中取得的最近成功的启发下,提出了基于 ChatGPT 的 Cypher 查询语言(CQL)生成框架,从给定的自然语言问题中生成最适合的 CQL 查询。我们的生成框架包括六个部分:根据给定的自然语言问题预测 CQL 的语法相关信息的辅助模型,从给定的自然语言问题中提取专有名词的专有名词匹配器,检索输入样例的相似示例的演示示例选择器,设计 ChatGPT 的输入模板的提示构造器,生成 CQL 的 ChatGPT 模型,以及从多样化的输出中获取最终答案的集成模型。凭借我们的基于 ChatGPT 的 CQL 生成框架,我们在 CCKS 2023 无人系统知识图推理问答竞赛中获得第二名,F1-score 为 0.92676。
Nov, 2023
本文提出一种基于 pipeline 分解方法的系统,能够回答复杂的自然语言查询,帮助工程师访问建模轨道空间碎片环境的知识库中的信息。该系统可以利用 GPT-3 生成的半合成数据和跨领域数据来进行训练,从而减少过拟合和快捷学习。
May, 2023
使用 RoBERTa + AT + KD 模型,本文在 CoQA 数据集上进行对话问答,单模型达到 90.4 的 F1 得分,比现有最先进的单模型高 2.6%。
Sep, 2019
本文提出了一种基于 SPARQL 查询的多语言语义 Web 知识库问答(QA)方法,能够查询多个知识库,可轻松移植到其他知识库和语言。通过对五个不同的知识库和五种语言的评估,证明了该方法的影响。
Mar, 2018
本篇论文提出了一种建立对话式问答系统的新数据集 CoQA,包含来自七个不同领域的 8,000 个对话中 127,000 个具有答案的问题,分析表明,这些问题比现有的阅读理解数据集具有更多挑战性和难点,需要针对性的解决方案,评测结果显示目前最好的系统 F1 得分为 65.4%,仍然有大量的改进空间。
Aug, 2018
通过设计自适应的网页检索器和高效地整合知识图谱三元组的方法,我们提出了增强型网页和高效知识图谱检索解决方案(EWEK-QA),以丰富系统提供的提取知识内容。我们的模型通过一系列定量分析和人工评估实验证明了 EWEK-QA 的有效性,显著提高了网页检索基线的相关段落提取率(>20%)、答案范围覆盖率(>25%)和自包含性(>35%),在 7 个定量问答任务和人工评估中明显优于仅使用网页或知识图谱的最新基线模型。
Jun, 2024