Feb, 2024

REBORN: 强化学习边界分割与迭代训练用于无监督 ASR

TL;DR无监督自动语音识别(ASR)的关键问题是在没有成对的语音 - 文本数据监督的情况下,学习语音信号与其相应的文本转录之间的映射。本文提出了一种名为 REBORN 的方法,用于无监督 ASR,通过交替训练分割模型和音素预测模型来学习语音和文本之间的映射,以提高无监督 ASR 的性能。