Jan, 2021

你的生物医学命名实体识别模型如何推广到新实体?

TL;DR本文系统地分析了生物识别模型的三种识别能力:记忆,同义词泛化和概念泛化,并发现现有模型在识别同义词和新的生物概念方面存在局限性,这表明他们的泛化能力被高估了。作者调查了模型的失败案例,并确定了识别未见过的生物词汇的几个困难。最后,作者采用基于统计的去偏置方法作为简单的补救方法,显示出对未见过的提及的泛化改进。希望本文的分析和发现能够促进对 NER 模型泛化能力的进一步研究。