Oct, 2017

倾听世界,提高语音命令识别

TL;DR研究卷积神经网络中的迁移学习在语音识别方面的应用,发现将来自不同任务的表示转移至声音专注的任务可以显著提高准确性。通过验证在音频数据集上使用更深层网络可以获得更好准确性的结果,提出一个使用扩张卷积的简单多尺度输入表示方法,以及通过将迁移学习和多尺度输入表示相结合来实现仅需要训练数据的 40% 即可获得相似准确性的模型。最后还提出多尺度输入和迁移学习的积极互动效应,表明两种技术的联合应用是有益的。