Jan, 2024

评估大型语言模型用于知识图谱上的语义解析对话问答

TL;DR评估了没有在此任务上进行明确预训练的大型语言模型的性能,并通过一系列实验在广泛的基准数据集上比较了具有不同提示技术和不同大小的模型,并确定了生成输出中的常见问题类型。结果表明,大型语言模型能够从对话中生成图查询,并通过少样本提示和微调技术实现显著提升,特别是对于展现较低零样本性能的较小模型。