BriefGPT.xyz
Jan, 2017
语音端到端无ASR关键词搜索
End-to-End ASR-free Keyword Search from Speech
HTML
PDF
Kartik Audhkhasi, Andrew Rosenberg, Abhinav Sethy, Bhuvana Ramabhadran, Brian Kingsbury
TL;DR
本研究探讨一种使用最少监督训练的无自动语音识别(ASR)的端到端(E2E)系统,用于基于文本查询的关键词搜索(KWS)系统,该系统由三个子系统组成:一个基于递归神经网络(RNN)的声学自动编码器,一个使用从卷积神经网络中学到的嵌入的字符级RNN语言模型,以及一个输入文本查询和声纹嵌入并预测查询是否出现在声纹信息中的前馈神经网络。
Abstract
end-to-end
(E2E) systems have achieved competitive results compared to conventional hybrid hidden Markov model (HMM)-deep
neural network
based automatic
→