Apr, 2018

基于展开迭代相位重建的端到端语音分离

TL;DR本研究提出了一种基于深度学习的端到端方法用于解决单通道无特定说话人的多人语音分离问题,通过利用时间 - 频率的掩蔽,短时傅里叶变换以及它的逆变换嵌入到深层网络中,通过在重建信号上直接计算损失函数来解决之前存在的位移不一致导致的重构误差问题,同时通过多次展开的反相位恢复算法进行训练,使用新的激活函数允许掩蔽值超过 1, 在公开可用的数据集上取得了目前最先进的分离效果。