本文提出了一种用于噪声环境下语音自动识别的新型深度循环神经网络模型,结合了深度神经网络和双向长短期记忆网络,在华尔街日报数据集上相较于传统深度神经网络模型提高了近 8%。
Apr, 2015
使用深度神经网络作为教师模型,通过知识迁移学习的方法,成功地训练了长短时记忆神经网络,以在自动语音识别任务中表现良好。
May, 2015
该论文介绍利用深度 LSTM 循环神经网络、CD 电话建模、帧叠加与减少帧率等技术来提高语音识别准确率的研究,并探讨了直接输出单词的 LSTM RNN 模型的初步结果。
Jul, 2015
本文研究了将深度网络的多层表示与强大的 RNN 模型相结合的模型 - 深度递归神经网络,通过合适的正则化和端到端的训练方法,该模型在 TIMIT 语音识别基准测试中获得了最佳记录得分 17.7%。
Mar, 2013
本文研究基于知识蒸馏的紧凑深度神经网络模型用于语音识别任务,并通过序列训练和适应进一步提高模型的准确率。在 AMI 会议语音识别语料库上的实验结果表明,该方法显著提高了模型的准确性,同时减小了模型参数规模与识别准确率之间的差距。
Aug, 2016
本研究对基于双向长短时记忆(LSTM)循环神经网络(RNN)的自动语音识别(ASR)进行了全面的研究,探索了深度、大小、优化方法等不同因素的影响,并通过实验分析在 Quaero 语料库上实现了提高词错误率的效果,并比较了不同的培训计算时间。
Jun, 2016
基于深度神经网络和语音识别技术的语音理解模型,可高度精确地模拟听取语音信息的相关属性,不需要干净的语音参考或单词标签。
Mar, 2022
本文提出在深度学习中使用门结构和双线性池化,在自动语音识别领域取得了较大的词错误率的优化。
Jan, 2022
本研究基于递归神经网络 (RNN) 提出了新的区分性嵌入模型,探讨了不同的训练损失,通过单词区分任务的评估发现,相比以往的模型,分类器和 Siamese RNNs 都有所改进,其中 Siamese RNNs 的表现更为优异,同时也对嵌入模型和网络结构等变量进行了分析。
Nov, 2016
本文章首次系统地比较了卷积神经网络与循环神经网络在多个自然语言处理任务上的表现,为深度学习网络的选择提供了基本指导。
Feb, 2017