Jul, 2016
使用深度聚类的单通道多说话者声音分离
Single-Channel Multi-Speaker Separation using Deep Clustering
Yusuf Isik, Jonathan Le Roux, Zhuo Chen, Shinji Watanabe, John R. Hershey
TL;DR本文使用基于深度学习的深度聚类方法及信号逼近技术,改进基线深度聚类算法,显著补偿了音频信号分离中的低信噪比问题,实现了在多说话人场景下的语音信号分离,通过自动语音识别实验,该算法在混响背景下将语音识别错误率从 89.1% 降至 30.8%,有效解决了鸡尾酒会效应问题。