Apr, 2018

像素的声音

TL;DRPixelPlayer是一种利用大量无标注视频进行学习的系统,该系统能够学习定位产生声音的图像区域,并将输入的声音分离成代表每个像素声音的组件。实验结果表明,我们提出的混合和分离框架在音源分离方面优于几种基线模型。