May, 2023

探究多语种机器翻译中的词汇共享在印度语言中的应用

TL;DR本文研究了多语言机器翻译中的词汇共享和转写等策略对翻译性能的影响,并探讨了数据采样和词汇大小之间的平衡。研究发现,转写并不能显著提高翻译性能,而原始脚本训练的多语言机器翻译模型对于不同脚本的语言具有较强的泛化能力。