Jul, 2016

面向说话人不可知的多人语音分离的深度模型置换不变训练

TL;DR本研究提出了一种新的深度学习模型,用于解决语音分离的 Cocktail-party 问题,它支持排列不变训练(PIT),实验表明 PIT 的有效性可以解决语音分离中的标签置换问题,从而实现自动会议记录和多方人机交互等的应用。