Nov, 2018
基于深度学习的说话人分离相位重建:三角函数视角
Deep Learning Based Phase Reconstruction for Speaker Separation: A Trigonometric Perspective
Zhong-Qiu Wang, Ke Tan, DeLiang Wang
TL;DR该研究采用深度学习对短时傅里叶变换领域中的单声道讲话人无关音频分离进行了相位重构实验,提出了三个基于迭代相位重构、组群延迟估计和相位差符号预测的算法,对公开的 wsj0-2mix 和 3mix 语料库进行了最先进的测试。