Aug, 2022

MultiCoNER:一个用于复杂命名实体识别的大型多语言数据集

TL;DR介绍了一种名为MultiCoNER的大型多语言数据集,可支持11种语言和3个领域的命名实体识别。使用两个NER模型对数据集进行了测试,并对其进行了评估。建立的模型都表现出了不俗的性能,但加入Gazetteers后性能提高了30%。希望这个数据集能够帮助研究人员建立更为健壮的命名实体识别系统。