关键词unsupervised automatic speech recognition
搜索结果 - 4
- REBORN: 强化学习边界分割与迭代训练用于无监督 ASR
无监督自动语音识别(ASR)的关键问题是在没有成对的语音 - 文本数据监督的情况下,学习语音信号与其相应的文本转录之间的映射。本文提出了一种名为 REBORN 的方法,用于无监督 ASR,通过交替训练分割模型和音素预测模型来学习语音和文本之 - 跨语言伪标记的无监督自动语音识别
研究表明,在没有成对的语音和文本的情况下,可以使用其他语言的字符级声学模型引导新语言的无监督自动语音识别系统,方法基于两个主要组成部分:使用其他语言 AM 生成目标语言的伪标签并用目标语言模型加以约束。
- 通过扩散 GAN 提升无监督语音识别
使用扩散 - GAN 提高无监督自动语音识别的敌对训练方法。将各种强度的实例噪声注入生成器的输出和来自预训练音素语言模型的未标记参考文本,使用时间步骤相关的判别器将它们分开,并将梯度反向传播更新生成器,实验表明该增强策略能有效地提高语音识别 - 无监督自动语音识别桥接语音和文本预训练模型
该研究提出了一种简单高效的无监督语音到语义预训练模型,使用无监督自动语音识别作为连接器,实现了不同任务的语音语言理解,其中包括最近热门的口语问答任务,并在 NMSQA 基准测试中达到了最新的最优结果。