Mar, 2024
跨模态伪标签半监督音频 - 视觉源定位
Cross Pseudo-Labeling for Semi-Supervised Audio-Visual Source Localization
Yuxin Guo, Shijie Ma, Yuhao Zhao, Hu Su, Wei Zou
TL;DR我们的研究聚焦于半监督 AVSL 中的伪标签方法,提出了一种名为 Cross Pseudo-Labeling(XPL)的新方法,通过交互学习和交叉精炼机制,避免偏见积累,并结合软伪标签和课程数据选择模块以实现稳定训练,实验证明 XPL 相较于现有方法在性能上显著优越,并在保持稳定性的同时有效减轻了确认偏见。