May, 2024

中继解码:为机器翻译串联大型语言模型

TL;DR通过使用 RD(Relay Decoding)方法,将两个不同的大型语言模型连接起来,并利用少量的平行数据进行训练,我们成功地在机器翻译任务中取得了优越的结果。在 Multi30k 和 WikiMatrix 数据集上进行的实验结果验证了我们提出的方法的有效性。