Sep, 2024

通过知识蒸馏与Whisper快速流式变换器自动语音识别原型开发

TL;DR本研究解决了在缺乏监督数据条件下训练自动语音识别(ASR)模型的难题。我们提出了一种新方法,利用伪标记语音有效地从头开始训练流式变换器-转导器(TT)模型,结果表明这种方法能够在各种语言上获得强大的ASR性能,且不需要大量的数据和计算资源。