Jul, 2024

基于大型语言模型和UMLS启发式规则的生物医学嵌套命名实体识别

TL;DR使用Mixtral 8x7B和ScispaCy NER模型识别生物医学文本中的8种嵌套命名实体,并基于统一医学语言系统(UMLS)语义类型构建自定义启发式规则,我们的系统在BioNNE验证集上获得0.39的F1得分和测试集上的0.348的F1得分。