Apr, 2024

VANER:利用大型语言模型进行多功能和自适应的生物医学实体识别

TL;DR利用开源的大型语言模型 LLaMA2 作为骨干模型,并设计特定指令来区分不同类型的实体和数据集,通过将骨干模型理解指令与序列标注技术相结合,使用多个数据集来训练一个能够提取各种类型实体的模型 VANER,集成外部实体知识库和使用指令调整,通过参数的小分区训练的 VANER 明显优于之前基于大型语言模型的模型,并且作为基于大型语言模型的模型,首次超过传统的 BioNER 系统大多数最先进的模型,实现了三个数据集中最高的 F1 分数。