May, 2023

跨语言机器翻译中的词汇表不足:增加语言间表示单词的相似度

TL;DR本论文提出了一种新的共享词汇的设计方法,通过定义词级别信息传递路径和使用图网络来融合跨语言的词嵌入,避免了多语言之间文字编码的问题,实验还表明该方法在高低资源多语言机器翻译中可实现显著的 BLEU 分数改进,且只需额外训练少于 1.0%的可训练参数,计算成本增加有限。