Feb, 2024

基于语言模型的本体中新概念定位框架

TL;DR使用语言模型将从文本中提取的新概念插入本体的任务中,我们探索了一种三步骤的方法:边缘搜索,边缘形成和丰富,边缘选择。在所有步骤中,我们提出利用神经方法,其中我们应用基于嵌入的方法和 BERT 等预训练语言模型的对比学习进行边缘搜索,并采用基于 BERT 微调的多标签边缘交叉编码器以及 GPT 系列、FLAN-T5 和 Llama 2 等大型语言模型进行边缘选择。我们评估了使用 SNOMED CT 本体和 MedMentions 实体链接基准创建的最新数据集上的方法。我们框架中的最佳设置使用了经过微调的预训练语言模型进行搜索,以及用于选择的多标签边缘交叉编码器。LLMs 的零 - shot 提示对于该任务仍然不足,因此我们提出了 LLMs 可解释指令调整以改进性能。我们的研究展示了预训练语言模型的优势,并突出了鼓舞人心的 LLMs 性能,这激发了未来的研究。