Feb, 2021

CTC 基础语音识别中的中间损失正则化

TL;DR本文提出了一种基于 CTC 目标的自动语音识别(ASR)的简单而高效的辅助损失函数,结合随机深度训练,应用于最近提出的 Conformer 网络,能够在没有语言模型的情况下实现 9.9%的单词错误率和 5.2%的字符错误率。