ACLMar, 2022

STEMM:基于语音文本流形混合的自学习语音翻译

TL;DR本研究提出了一种名为 STEMM 的方法来解决语音 - 文本翻译时,因跨模态表示不匹配导致数据标注不足的问题。该方法通过混合不同模态的表示序列,利用自学习框架来规范预测输出,能够有效地减轻跨模态表示不匹配并在 8 个翻译方向上达到了显著提高。