Jun, 2016
面向完全无监督大词汇语音识别的分段框架
A segmental framework for fully-unsupervised large-vocabulary speech recognition
Herman Kamper, Aren Jansen, Sharon Goldwater
TL;DR本文介绍了一种基于贝叶斯建模框架和语音嵌入向量的无监督语音识别方法,针对多个讲话者的语音数据进行了初步探索,最终通过顶层一致性分割和底层音节边界检测方法得出更好的单人和多人语音聚类结果。