Jan, 2024

TransliCo: 解决多语种预训练语言模型中的脚本障碍的对比学习框架

TL;DR通过 TransliCo 框架中的 Transliteration Contrastive Modeling (TCM) 对 mPLM 进行精调,通过对其训练数据中的句子及其在统一脚本 (Latn) 中的音译进行对比,确保了不同脚本的统一表示空间,解决了多语言预训练语言模型在跨语言知识学习中面临的脚本障碍,并表现出更好的性能。