Apr, 2021

迭代对比学习的无监督声音定位

TL;DR本文提出了一种无需数据注释的迭代对比学习框架,用于声音定位任务,在图像中预测的定位结果和从音频信号中推断的语义关系被用作伪标签,并通过迭代策略逐渐促进声源的定位。实验结果表明,该框架在声音定位任务上表现良好,优于现有的无监督和弱监督方法。