Oct, 2020

联合掩码 CPC 和 CTC 训练用于自动语音识别

TL;DR这篇论文介绍了一种利用自监督学习方法,通过单阶段训练自动语音识别模型,利用标记数据和非标记数据来训练模型,实现了对下游任务性能的直接优化,并在 Librispeech 100-hour 数据集上实现了类似于 wav2vec ~2.0 的词错误率,最后提出解决对比任务是计算 CTC 损失的正则化的假设。