Mar, 2024

跨模态伪标签半监督音频 - 视觉源定位

TL;DR我们的研究聚焦于半监督 AVSL 中的伪标签方法,提出了一种名为 Cross Pseudo-Labeling(XPL)的新方法,通过交互学习和交叉精炼机制,避免偏见积累,并结合软伪标签和课程数据选择模块以实现稳定训练,实验证明 XPL 相较于现有方法在性能上显著优越,并在保持稳定性的同时有效减轻了确认偏见。