Apr, 2024

ActiveRIR: 主动音频视觉探索声学环境建模

TL;DR通过使用视觉和声音传感器数据,我们提出了一种新的任务 —— 主动声学采样,其通过移动代理在实时环境中建立环境声学模型和占据地图,以及确定最佳声学数据采样位置,从而以最少的声学样本得到高质量的环境声学模型。我们通过基于环境声学模型中的信息增益的新型强化学习奖励来训练我们的策略,在来自先进声学模拟平台的多样未知室内环境上评估,发现 ActiveRIR 优于传统导航代理、基于空间新颖性和视觉探索的方法以及现有最先进的方法。