Mar, 2016

无监督词语分割与词汇发现:基于声学词嵌入的方法

TL;DR提供了一种基于无监督贝叶斯模型的语音分割以及聚类算法,通过将有潜力的单词段嵌入固定维度的声学向量空间,并在此空间创建全词声学模型以及同时执行分割来实现输入语音基于单词类型的完整无人监督标记,模型在连接数字识别任务中取得约 20% 的错误率,优于基于 HMM 的系统。