Aug, 2023

多目标音频视觉导航使用声音定向图

TL;DR我们提出了一个新的框架,用于多目标音视频导航任务,并研究了这个任务相对于当前导航任务的困难性。我们采用一种名为声音方向图(SDM)的方法来缓解这个新任务的困难,该方法在学习的基础上动态地定位多个声音源。实验结果表明,无论目标数量如何,使用 SDM 能显著提高多个基准方法的性能。