EMNLPDec, 2023

使用 Fisher 信息矩阵在多语言翻译模型中聚类伪语系

TL;DR通过使用费舍尔信息矩阵(FIM)将语言家族进行聚类,我们提出了一种创新的方法来解决多语言翻译模型训练阶段数据集变化所带来的挑战,并定义了伪语言家族。实证评估结果显示,采用这些伪语言家族能够在适应陌生语言对的多语言翻译模型中提高性能,该方法也可扩展到对语言相似度进行测量的场景。