Oct, 2023

将预训练语言模型整合到神经机器翻译中

TL;DR本研究提出了一种整合预训练语言模型和神经机器翻译的方法(PiNMT),通过引入 PLM 多层转换器、嵌入融合和余弦对齐等关键组件以及分离学习率和双步训练等训练策略,实现了 PLM 与 NMT 的有效整合,提升了性能,并在 IWSLT'14 数据集上取得了最新的研究成果。