Feb, 2024

UniEnc-CASSNAT:一种仅编码器非自回归式语音 SSL 模型的 ASR

TL;DR提出了一种新的基于编码器的非自回归自动语音识别 (UniEnc-CASSNAT) 模型,将 CTC 和 CASS-NAT 的优势相结合,取得了最先进的非自回归自动语音识别结果,并且比只有编码器的 CASS-NAT 模型具有更少的模型参数。