Apr, 2022

MAESTRO: 通过模态匹配匹配语音文本表示

TL;DRMaestro 是一个自我监督的训练方法,以统一从语音和文本模态中学到的表示。 该算法通过序列对齐,持续预测和匹配来学习统一的表示,以用于自动语音识别(ASR)和语音翻译(ST)等下游实验。