BriefGPT.xyz
Ask
alpha
关键词
non-autoregressive automatic speech recognition
搜索结果 - 2
UniEnc-CASSNAT:一种仅编码器非自回归式语音 SSL 模型的 ASR
提出了一种新的基于编码器的非自回归自动语音识别 (UniEnc-CASSNAT) 模型,将 CTC 和 CASS-NAT 的优势相结合,取得了最先进的非自回归自动语音识别结果,并且比只有编码器的 CASS-NAT 模型具有更少的模型参数。
PDF
5 months ago
基于 CTC 的语音识别的单模聚合
该论文提出了一种非自回归自动语音识别方法,使用一种单模态聚合(UMA)来分割和整合属于同一文本令牌的特征帧,从而学习更好的文本令牌特征表示。与常规 CTC 相比,该方法学习到更好的特征表示,并缩短了序列长度,从而降低了识别错误和计算复杂度。
→
PDF
10 months ago
Prev
Next