Apr, 2019

视觉对象声音的分离

TL;DR本文提出了一种共分离训练范式,可以从未标记的多源视频中学习对象级别的声音,通过新颖的训练目标,训练出深度神经网络的分离音频对于外观相似的对象具有一致性可识别的特性,从而在音频源分离和降噪方面获得了最先进的结果。