Dec, 2015

使用基于字符级递归神经网络实现的在线关键词检测

TL;DR本文提出了一种基于字符级递归神经网络(RNN)的上下文感知关键词检测模型,用于连续语音中的口语项检测,通过端到端训练生成字符和单词边界标签的概率。该模型无需音标转录、Senone 建模或系统词典,可以通过编辑基于文本的关键词列表轻松添加和修改关键词,而无需重新训练 RNN。此外,单向 RNN 处理无限长度的输入音频流,无需预分段,在话语结束前就可以低延迟地检测到关键词。实验结果表明,所提出的关键词探测器比基于深度神经网络(DNN)和隐马尔可夫模型(HMM)的关键词填充器模型具有更好的性能,即使计算量更少。