Jun, 2024

Whistle: 数据高效的多语言和跨语音识别模型:通过弱语音监督方法实现

TL;DR本文研究了预训练与弱语音监督的方法,提出了一种名为Whistle的数据有效MCL-ASR方法,通过国际音标转写,构建了一个基于CommonVoice数据集的实验平台,实验证明基于音素的模型在多语言语音识别中具有更好的性能和高数据效率。