Jul, 2024

用多语言编码器和知识蒸馏增强低资源的神经机器翻译:一个案例研究

TL;DR基于预训练语言模型和知识蒸馏的 seq2seq 架构,用于辅助低资源语言的翻译,包括 mBART-50 不支持的印度次大陆语言。在三种印度低资源语言的四个印度语之间进行评估,与基准相比,蓝-4 和 chrF 显著提高,人工评估也证实了我们方法的有效性。