ICLRNov, 2016

多视角循环神经声学词嵌入

TL;DR本研究用多视角学习、双向 LSTM 嵌入模型和多视角对比损失函数等方法学习神经音频单词嵌入,实现在语音检索和识别任务中避免模棱两可的子词表示,改善词汇区分效果,并在交叉视图词区分和词相似度等其他任务中展示了应用前景。