将 GPT-3 与 Few-Shot Sequence-to-Sequence 语义解析结合应用于 Wikidata

May, 2023

将 GPT-3 与 Few-Shot Sequence-to-Sequence 语义解析结合应用于 Wikidata

Complementing GPT-3 with Few-Shot Sequence-to-Sequence Semantic Parsing over Wikidata

Silei Xu, Theo Culhane, Meng-Hsi Wu, Sina J. Semnani, Monica S. Lam

TL;DR本文介绍了基于 Wikidata 的高质量知识库问答基准测试 ——WikiWebQuestions，并使用 SPARQL 注释的真实人类数据建立基准，探讨了基于 Seq2Seq 语义解析器的有效训练数据合成方法以及大型噪声知识图谱的处理方法。实验结果表明，本方法有效，在 dev 集和 test 集中分别达到 69％和 59％的答案准确率。本文还展示了将语义解析器与 GPT-3 组合以提供可验证的结果和合格的猜测，以回答本基准测试集中 97％的问题。

Abstract

As the largest knowledge base, wikidata is a massive source of knowledge, complementing large language models with well-structured data. In this paper, we present WikiWebQuestions, a high-quality →

wikidata knowledge base question answering sparql annotation semantic parser

发现论文，激发创造

评估语义解析与基于简单 Web 的问答模型的对比

本文探讨通过与基于抽取网页片段的问答基线相比较，基于语义分析的问答模型的评估方法。在 COMPLEXQUESTIONS 数据集上，我们发现我们的模型获得了合理的表现。

Jul, 2017

基于维基数据的多语义解析中的构成性泛化

本篇文章提出了一种基于 Wikidata 的多语言、平行的问句对数据集，即 Multilingual Compositional Wikidata Questions（MCWQ），用于分析语义解析器在英语、希伯来语、卡纳达语和汉语中的组合泛化能力。结果表明，即使使用最先进的预训练多语言编码器，跨语言组合泛化能力也无法实现，文章的方法、数据集和结果将有助于未来关于具有更现实和多样化背景下语义解析的研究。

Aug, 2021

面向知识图谱的对话问答的语义解析

本文介绍了使用自然语言处理技术的语义解析器，将用户的自然语言问题转化为有形式定义的查询语句，通过大规模知识图谱实现。作者提供了一个数据集，其中，用户问题采用 Sparql 语言解析，并对执行结果对系统回答进行注释。通过两种不同的语义解析方法，我们提出了挑战：如何处理大规模词汇，如何建模对话语境，如何处理多实体查询语句，并实现对新问题进行泛化。作者希望我们的数据集能够为开发会话式语义解析器提供有效的测试平台。本文的数据集和模型已经发布，详情请见链接。

Jan, 2023

评估 GPT 的知识库完善潜力

结构化知识库与语言模型的能力评估，发现 GPT-3 等模型可用于在大规模公开知识库 Wikidata 上进行知识补全，提高精度并增加了 2700 万条事实。

Oct, 2023

SPARQL 语义解析的现代基准

本文研究如何从自然语言问题中生成 SPARQL 查询，并且使用预训练语言模型进行了实验，发现 T5 模型能够在此任务上取得卓越性能，并且还能够使用新的语义解析范例

Apr, 2022

为知识图谱问答生成使用实体预训练 GPT 的 SPARQL

我们的研究致力于通过自然语言处理工具和创意鼓励来解决大众用户查询知识图谱的问题，我们的方法是通过正确的实体链接和训练 GPT 模型从自然语言问题中创建 SPARQL 查询，我们获得了在测试中 3 次查询命中准确度为 62.703%，实体链接挑战的 F1 值为 0.809，问题回答挑战的 F1 值为 0.009。

Feb, 2024

从 SQL 查询中生成问题改善了神经语义解析

本文通过在最大手工标注语义解析数据集 WikiSQL 上展示问题生成是一种有效的半监督学习方法，使我们能够用百分之三十的监督训练数据来学习最先进的神经网络语义解析器，并发现语义解析器的准确性和训练数据量之间存在对数关系。

Aug, 2018

评估大型语言模型用于知识图谱上的语义解析对话问答

评估了没有在此任务上进行明确预训练的大型语言模型的性能，并通过一系列实验在广泛的基准数据集上比较了具有不同提示技术和不同大小的模型，并确定了生成输出中的常见问题类型。结果表明，大型语言模型能够从对话中生成图查询，并通过少样本提示和微调技术实现显著提升，特别是对于展现较低零样本性能的较小模型。

Jan, 2024

神经机器翻译用于查询构建和组合

本论文研究了使用神经机器翻译范式进行问题解析的应用，采用序列到序列模型来学习 SPARQL 图查询语言及其组合中的图形模式。通过模板构建问题和查询之间的对齐情况，探讨半监督学习方法代替问题 - 答案对诱导程序，并且借助自然语言生成的新进展扩展语言表达的覆盖范围。

Jun, 2018

GPT-3 对少样本基于知识的 VQA 的经验研究

使用图像描述作为提示，通过 GPT-3 来实现基于知识的多模态问题回答，采用少样本学习，使 PICa 在两个数据集中超过有监督的最先进水平。

Sep, 2021