May, 2023

将 GPT-3 与 Few-Shot Sequence-to-Sequence 语义解析结合应用于 Wikidata

TL;DR本文介绍了基于 Wikidata 的高质量知识库问答基准测试 ——WikiWebQuestions,并使用 SPARQL 注释的真实人类数据建立基准,探讨了基于 Seq2Seq 语义解析器的有效训练数据合成方法以及大型噪声知识图谱的处理方法。实验结果表明,本方法有效,在 dev 集和 test 集中分别达到 69%和 59%的答案准确率。本文还展示了将语义解析器与 GPT-3 组合以提供可验证的结果和合格的猜测,以回答本基准测试集中 97%的问题。