May, 2023

预训练编码器和解码器之间的有效连接,用于语音翻译

TL;DR本研究提出了一种互连机制,通过加权求和来聚合语言预训练模型的每一层信息并输入到解码器中,从而提高了 BLEU 大约 2 分,在冻结语言预训练模型时加入了 2K 的参数。此外,我们通过可视化层权重,发现每个语言的每层的贡献是不同的。