Jun, 2024

SPEAR:接收器对接收器声学神经扭曲场

TL;DR我们提出了 SPEAR,这是一种连续的接收器到接收器声学神经弯曲场,用于在一个声学三维空间中预测声学效应,具有单个静止音源。与传统的从源到接收器建模方法不同,该方法需要先验的空间声学特性知识来严格建模源到接收器的声音传播,我们提出通过将空间声学效应从一个参考接收器位置弯曲到另一个目标接收器位置来进行预测,从而使弯曲的声音包含目标位置的所有空间声学效应。SPEAR 可以以一种更容易获取的方式进行训练,我们只需让两个机器人在不同位置独立记录空间音频。我们进一步从理论上证明了弯曲场的通用存在性,仅当存在一个音频源时才存在。我们将三个物理原理纳入 SPEAR 网络设计中,从而使学习到的弯曲场在物理上具有意义。我们展示了 SPEAR 在合成的逼真数据集、照片级真实数据集和真实世界数据集上的优越性,显示了 SPEAR 在各种下游机器人任务中的巨大潜力。