Aug, 2023

端到端语音到文本翻译中一致性正则化的实证研究

TL;DR通过经验研究,本文针对端到端语音转文本翻译提出了两种训练策略:SimRegCR 和 SimZeroCR,以实现一致性正则化的最新性能。在 MuST-C 基准测试中,在大多数翻译方向上,我们的方法取得了最先进的性能。分析证明,由内部一致性带来的正则化对于常规的端到端语音转文本翻译至关重要,而跨模态一致性可消除模态差异并提升零 - shot 端到端语音转文本翻译性能。