ACLMay, 2023

MasakhaPOS: 面向具有语言学多样性的非洲语言的词性标注

TL;DR本文提出了 MasakhaPOS 数据集,并利用条件随机场、多语言预训练语言模型、跨语言传递模型以及交叉语言参数高效微调等方法来解决非常规非洲语言的词性标注问题。实验结果表明,选择最佳的传递语言可显著提高目标语言的 POS 标注性能,特别是结合跨语言参数高效微调方法时。关键是,从与目标语言匹配的语言传递知识似乎对未见过的语言的 POS 标记更有效。