Jul, 2022

重新思考在中文命名实体识别中的地名词典价值

TL;DR本文通过重新检验增强命名实体识别的常见做法和详细分析模型性能和词表特征之间的关系,指导我们构建更合适的词表。发现:(1)词表有助于解决传统 NER 模型难以学习的情况。(2)模型性能极大地受益于高质量的预训练词汇嵌入。(3)一个好的词表应该涵盖更多在训练集和测试集中都能匹配到的实体。