May, 2023
跨语言机器翻译中的词汇表不足:增加语言间表示单词的相似度
Beyond Shared Vocabulary: Increasing Representational Word Similarities across Languages for Multilingual Machine Translation
Di Wu, Christof Monz
TL;DR本论文提出了一种新的共享词汇的设计方法,通过定义词级别信息传递路径和使用图网络来融合跨语言的词嵌入,避免了多语言之间文字编码的问题,实验还表明该方法在高低资源多语言机器翻译中可实现显著的 BLEU 分数改进,且只需额外训练少于 1.0%的可训练参数,计算成本增加有限。