ACLJun, 2023

模态适应还是正则化?以端到端语音翻译为例的案例研究

TL;DR该研究发现,在端到端语音翻译 (E2E ST) 的预训练和微调中,存在语音和文本数据之间的模态差异,但该差异只在微调的早期阶段产生影响。然而,另一个 “容量差距” 则是高资源任务总是需要一个大模型来适应,当模型被重用于低资源任务 (E2E ST) 时,由于过拟合会导致次优性能。研究发现,规范化方法对于优化模型比模态适应方法更加重要,在 MuST-C 数据集上的实验中,可以获得 29.0 (en-de) 和 40.3 (en-fr) 的性能。