Oct, 2021

跨语言 monolingual wav2vec-2.0 的魔法尘

TL;DR该研究提出了一种简单有效的跨语言转移学习方法,以适应资源匮乏语言的单语言wav2vec-2.0模型的自动语音识别(ASR),并通过使用目标语言中的一组适度大小的无标签语音数据集和几个Dropout不确定性驱动的自我训练(DUST)迭代进一步提高其性能。该调整后的wav2vec-2.0在目标语言ASR任务上达到了类似于训练了53种语言的顶级多语言XLSR模型的性能。