Apr, 2018

使用卷积神经网络预测未见过的广播节目的 ASR 表现

TL;DR本文研究了如何使用卷积神经网络对未见过的广播节目语音识别性能进行预测,并比较了传统基于回归的性能预测方法和基于卷积神经网络的新策略。该研究尤其关注了音频信号和 ASR 文本样本的联合使用对预测准确性的影响,并证实了基于卷积神经网络的预测能够非常准确地预测广播节目中的语音识别错误率分布。