ECCVApr, 2022

通过自监督的时间延迟估计实现声音定位

TL;DR该研究提出了使用自我监督的对比随机游走技术来学习立体声音频的对应关系,进而实现对声音的时间延迟估计,同时提出了一种多模态对比学习模型,可应用于特定人员在多扬声器混音情况下的面部视觉定位任务。