Apr, 2015

基于卷积深度神经网络的深度卡拉 OK:从音乐混音中提取人声

TL;DR通过训练一个拥有十亿参数的卷积深度神经网络来从真实世界的音乐混合物中提供声音分离的理想二值掩蔽的概率估计,以对抗更传统的线性方法,该方法可以用于自动消除卡拉 OK 类型应用程序中的歌唱声。