BriefGPT.xyz
大模型
Ask
alpha
关键词
audio-visual source localization
搜索结果 - 4
跨模态伪标签半监督音频 - 视觉源定位
我们的研究聚焦于半监督 AVSL 中的伪标签方法,提出了一种名为 Cross Pseudo-Labeling(XPL)的新方法,通过交互学习和交叉精炼机制,避免偏见积累,并结合软伪标签和课程数据选择模块以实现稳定训练,实验证明 XPL 相较
→
PDF
4 months ago
双重导师:一种无偏的音频 - 视觉源定位半监督框架
提出一种新的半监督学习框架,称为 Dual Mean-Teacher(DMT),通过两个教师 - 学生结构绕过确认偏差问题,充分利用有标签和无标签数据,通过教师之间的一致性过滤噪声样本并生成高质量的伪标签,从而在 Audio-Visual
→
PDF
4 months ago
CVPR
通过假阴性感知对比学习学习音频 - 视觉源定位
本研究提出了一种新的自监督音视频源定位学习策略,名为 False Negative Aware Contrastive(FNAC),旨在缓解真实世界训练中的错误负样本问题。该方法基于对单模态相似性的利用,可以识别类似样本并构建相应的邻接矩阵
→
PDF
a year ago
弱监督音视频来源定位的深入探究
本文提出了一种新的视听源定位方法,通过扩展音频图片嵌入的训练数据以及采用新的评估方法来解决定位不准确和过拟合的问题。
PDF
2 years ago
Prev
Next