Dec, 2023

基于大型语言模型的零射击和少射击知识图谱三元组提取

TL;DR在本研究中,我们测试了不同规模的大型语言模型在零次和少次侦查设置下的三元组提取(Triplet Extraction)能力。我们提出了一种通过从知识库(Knowledge Base)动态收集上下文信息(以上下文三元组和(句子,三元组)对的形式呈现为示例),并通过提示将其提供给语言模型的管道。附加的上下文信息使得大型语言模型在基于双向长短期记忆(BiLSTM)网络架构的所有旧的完全训练基线上具有竞争力。我们进一步对收集到的知识库上下文质量进行了详细分析,发现它与模型的最终三元组提取性能密切相关。相比之下,模型的规模似乎只会对大型语言模型的三元组提取能力带来对数级的改进。