Jan, 2017

语音端到端无ASR关键词搜索

TL;DR本研究探讨一种使用最少监督训练的无自动语音识别(ASR)的端到端(E2E)系统,用于基于文本查询的关键词搜索(KWS)系统,该系统由三个子系统组成:一个基于递归神经网络(RNN)的声学自动编码器,一个使用从卷积神经网络中学到的嵌入的字符级RNN语言模型,以及一个输入文本查询和声纹嵌入并预测查询是否出现在声纹信息中的前馈神经网络。