Jun, 2021

SynthASR: 用于语音识别的合成数据解锁

TL;DR本文提出了一个多阶段训练策略, 包括数据增强,编码器冻结和参数正则化,并利用人工合成音频提高医疗用途语音识别(ASR)的识别性能,降低了生产数据的成本和依赖性。