Nov, 2023

自供知识图谱:无监督程序合成用于零样本知识图谱问答

TL;DRBYOKG是一种通用的问答系统,可以在任何知识图(KG)上运作,无需人工标注的训练数据,并且可以在一天内准备好使用,它通过探索未知知识图中的信息(从随机节点开始,检查相邻节点和边缘的标签,并将其与先有的世界知识结合)来模拟人类对信息的理解能力。BYOKG使用一个以语言模型为基础的符号代理进行探索,生成多样的查询程序示例,并使用这些示例来进行检索增强推理,从而预测任意问题的程序。BYOKG在小规模和大规模图上都非常有效,在GrailQA和MetaQA数据集上的零样本基准测试上,QA准确性极大提高,分别达到27.89和58.02的F1值。在GrailQA数据集上,我们进一步展示了我们的无监督BYOKG的表现优于监督的上下文学习方法,证明了探索的有效性。最后,我们发现随着持续的探索和基础语言模型的改进,BYOKG的性能可靠地提升,尤其在GrailQA的子样本零样本测试中,F1值比最先进的微调模型高出7.08。