Apr, 2024

自我监督表示在自动语音识别中的高效注入

TL;DR我们提出了两种简单的方法,使用逐帧加法和交叉注意机制来高效地将自监督学习模型的表示纳入ASR架构,从而在训练期间避免使用自监督学习模型,加快了训练速度,并在Librispeech和Tedlium数据集上相较于基准模型实现了显著性能提升。