Apr, 2024

mOthello: 跨语言表示对齐和跨语言迁移在多语言模型中的出现时机

TL;DR预训练的多语言模型在交叉语言迁移方面展现出了能力,本研究旨在探讨学习语言中性表示的因素以及该表示是否足以促进交叉语言迁移。通过引入“锚定标记”,可以帮助跨语言表示对齐,而仅仅学习语言中性表示是不足以促进交叉语言迁移的。基于研究结果,提出一种新的方法 - 统一输出空间的多语言预训练 - 既能够诱导学习语言中性表示,又能促进交叉语言迁移。