ACLApr, 2022

多语种模型有效获取注释

TL;DR本研究通过采用单一模型在多语种数据上进行联合学习的策略,比起传统的在每种语言上单独训练模型和通过高资源语言进行零样本迁移的方法,性能显著提高。同时,主动学习可以进一步提高数据利用率。在 4 种和 5 种语言的分类、序列标注和句法分析任务中,该方法表现出了显著优越性,在有限的预算下构建多语种模型的可行性得到了很大提高。