COLINGMay, 2021

DaN+:丹麦嵌套命名实体和词汇规范化

TL;DR介绍了 DaN+,一个新的、支持跨语种跨领域学习的丹麦嵌套命名实体(NEs)和词汇归一化的多领域语料库和标注指南。评估了三种策略来建模双层命名实体识别任务,证实多任务学习是最坚实的策略,并且在最规范的数据中,使用本语言 BERT 和词汇归一化是最有利的。