Mar, 2024

双重导师:一种无偏的音频 - 视觉源定位半监督框架

TL;DR提出一种新的半监督学习框架,称为 Dual Mean-Teacher(DMT),通过两个教师 - 学生结构绕过确认偏差问题,充分利用有标签和无标签数据,通过教师之间的一致性过滤噪声样本并生成高质量的伪标签,从而在 Audio-Visual Source Localization(AVSL)中取得了明显优于当前先进方法的性能。