Oct, 2022

SAN: 一个强健的端到端自动语音识别模型架构

TL;DR本研究提出一种新颖的 Siamese Adversarial Network (SAN) 结构,可以显著降低字符误差率(CER),实现了自动语音识别任务上的新突破。该网络能够捕捉到更多的声学特征,同时优化输出分布,适用于含有不清晰音频的数据集。