Oct, 2023
EMMA-X:一种 EM 样本的多语言预训练算法,用于跨语言表示学习
EMMA-X: An EM-like Multilingual Pre-training Algorithm for Cross-lingual Representation Learning
Ping Guo, Xiangpeng Wei, Yue Hu, Baosong Yang, Dayiheng Liu...
TL;DR提出 EMMA-X: 一种基于 EM 模型的多语种预训练算法,通过大规模非平行数据学习跨语言的通用语义,实现语义关系预测和跨语言表示学习的统一,取得了最新技术的表现。