Oct, 2022

MasakhaNER 2.0:面向非洲的命名实体识别迁移学习

TL;DR本文研究非洲语言在自然语言处理上的挑战,针对命名实体识别任务,创造了包含20种非洲语言的最大人工标注数据集,研究了现有跨语言传递方法的表现,并发现选择最佳传递语言相较使用英语,可以提高零-shot F1分数14点。