May, 2021

使用预训练模型和适配器进行端到端的语音翻译:UPC 在 IWSLT 2021

TL;DR本文介绍了 UPC 机器翻译小组提交给 IWSLT2021 离线语音翻译任务的参赛作品,是一个基于端到端的离线语音翻译系统,采用预训练模型 Wav2Vec 2.0 和 mBART 的联合技术,在仅训练 20% 的参数的前提下获得了 27.3 的 BLEU 分数,并采用 Adapter 及预训练技术提高了收敛速度和最终结果,最后使用 Ensemble 模型取得 28.22 的 BLEU 分数,同时还使用了一种自定义细分算法,在 IWSLT2019 测试集上相对于给定细分的结果提高了 2.5 到 3 的 BLEU 分数。