Jul, 2020

通过概率空间建模的自监督神经音频视觉声源定位

TL;DR该论文介绍了一种利用 360 度图像和多通道音频信号的自监督训练方法来训练深度神经网络以区分多个声源对象的系统,旨在解决自主机器人理解周围环境的问题。