NLQxform: 基于语言模型的问题到 SPARQL 的转换器

Nov, 2023

NLQxform: 基于语言模型的问题到 SPARQL 的转换器

NLQxform: A Language Model-based Question to SPARQL Transformer

Ruijie Wang, Zhiruo Zhang, Luca Rossetto, Florian Ruosch, Abraham Bernstein

TL;DR这篇研究论文介绍了一种名为 NLQxform 的问答系统，它基于变压器模型 BART，可以通过自然语言界面访问学术知识图谱，实现复杂查询意图的转换和信息检索。在 Scholarly QALD Challenge 中，NLQxform 在 QA 任务上获得 0.85 的 F1 分数，并在排行榜上名列第一，展示了系统的竞争力。

Abstract

In recent years, scholarly data has grown dramatically in terms of both scale and complexity. It becomes increasingly challenging to retrieve information from scholarly knowledge graphs that include large-scale h

scholarly data knowledge graphs question-answering system nlqxform transformer-based language model

发现论文，激发创造

从自然语言翻译到 SPARQL 的神经机器翻译

本篇论文采用八种不同的神经机器翻译模型，探讨将自然语言问题翻译成结构化查询语言 SPARQL 的方法，结果表明基于 CNN 的架构效果最佳， BLEU 分数高达 98，准确率高达 94%。

Jun, 2019

利用 LLM 在学术知识图谱问答中的优化

使用大型语言模型，该研究论文介绍了一种学术知识图谱问答（KGQA）系统，通过少量示例解决书目自然语言问题。模型使用基于 BERT 的句子编码器来识别与给定测试问题相关的前 n 个相似训练问题，并检索它们对应的 SPARQL 查询。利用前 n 个相似问题 - SPARQL 对作为示例以及测试问题创建提示，并将其传递给大型语言模型以生成 SPARQL 查询。最后，在底层知识图谱（Open Research KG）端点上运行 SPARQL 查询并返回答案。该系统在 Scholarly-QALD-23 挑战基准中的 SciQA 数据集上获得了 99.0% 的 F1 分数。

Nov, 2023

利用 Transformer 语言模型简化段落级问题生成

Question generation is a natural language generation task that can be achieved with a single Transformer-based unidirectional language model, which outperforms QG baselines and produces high-quality questions that are relevant to their context paragraph and easy to answer, utilizing transfer learning without relying on auxiliary data.

May, 2020

基于 Transformer 的语言模型在抽取式问答中的比较研究

本文旨在研究和比较不同的预训练语言模型在回答问题的能力上的表现，通过使用 Bert-BiLSTM 结构模型的效果来检验双向流的加入是否能够提高模型性能，并发现 RoBERTa 和 BART 表现最佳。

Oct, 2021

具有句法信息的异构图变换器问答

本研究探讨了如何在不需要从头开始的情况下，在预训练的神经语言模型中添加显式的语言学信息，以提高其性能，并提出了一种基于转换器的神经语言模型，通过异构图转换器对模型进行扩展和微调，这可以通过添加句法信息来实现，而基于斯坦福问答数据集的实证性能评估表明了该方法的竞争性。此方法包括语义和语用方面的信息，具有可扩展性。

Apr, 2022

基於大型語言模型的無人系統知識庫問答的上下文學習

基于知识库的问答（KBQA）旨在根据知识库来回答事实性问题。本研究针对无人系统中的知识图推理问答的 CCKS2023 竞赛，在 ChatGPT 和 GPT-3 等大型语言模型在许多问答任务中取得的最近成功的启发下，提出了基于 ChatGPT 的 Cypher 查询语言（CQL）生成框架，从给定的自然语言问题中生成最适合的 CQL 查询。我们的生成框架包括六个部分：根据给定的自然语言问题预测 CQL 的语法相关信息的辅助模型，从给定的自然语言问题中提取专有名词的专有名词匹配器，检索输入样例的相似示例的演示示例选择器，设计 ChatGPT 的输入模板的提示构造器，生成 CQL 的 ChatGPT 模型，以及从多样化的输出中获取最终答案的集成模型。凭借我们的基于 ChatGPT 的 CQL 生成框架，我们在 CCKS 2023 无人系统知识图推理问答竞赛中获得第二名，F1-score 为 0.92676。

Nov, 2023

SPARQL 作为外语

本文提出了一种称之为 Neural SPARQL Machines 的神经网络模型，该模型通过 seq2seq 训练模式将自然语言翻译成 SPARQL 查询，从而提高 Linked Data Cloud 上的问题搜寻效率。

Aug, 2017

神经机器翻译用于查询构建和组合

本论文研究了使用神经机器翻译范式进行问题解析的应用，采用序列到序列模型来学习 SPARQL 图查询语言及其组合中的图形模式。通过模板构建问题和查询之间的对齐情况，探讨半监督学习方法代替问题 - 答案对诱导程序，并且借助自然语言生成的新进展扩展语言表达的覆盖范围。

Jun, 2018

FlexKBQA: 一个灵活的 LLM 驱动框架用于少样本知识库问答

FlexKBQA 是一种利用大型语言模型解决少样本知识库问答任务的方法，通过自动化算法从知识库中生成多样的程序，利用语言模型将其转化为自然语言问题。该方法还引入了执行引导自训练的策略来缓解合成数据和真实用户问题之间的分布差异，并利用大型语言模型的推理能力来增强整个框架。在 GrailQA、WebQSP 和 KQA Pro 上的实验证明，FlexKBQA 在少样本甚至零样本情景下，只需少量注释即可达到令人印象深刻的结果，超过了所有之前的基准，并且接近于监督模型的性能，相对于完全监督模型性能达到 93%。我们认为 FlexKBQA 在大型和轻量级模型的更好集成方面代表了重要进展。

Aug, 2023

知识图谱通用问答平台

本文提出了 KGQAn，一个通用的 QA 系统，它不需要为每个目标 KG 进行定制，而是采用一种新颖的形式化方法将问题理解为一个文本生成问题，并通过神经序列到序列模型将问题转换为中间抽象表示。我们还开发了一个即时链接器，在查询时间使用 RDF 存储的公共可访问 API 和现有索引将抽象表示映射到特定 KG 的 SPARQL 查询，而无需任何预处理。我们在几个真实的 KG 上进行的实验表明，KGQAn 易于部署，对于任意的 KG 表现良好，优于现有的 QA 系统。

Mar, 2023