Sep, 2023

SSVOD:带有稀疏标注的半监督视频物体检测

TL;DR通过利用视频的动态运动特性,我们引入了 SSVOD,一个端到端的半监督视频目标检测框架,以利用大规模未标记的帧和稀疏注释来选择性地组装鲁棒的伪标签,并通过结合硬伪标签和软伪标签的置信度阈值进行伪标签的确认偏见和不确定性噪声的平衡,从而在 ImageNet-VID,Epic-KITCHENS 和 YouTube-VIS 数据集上实现了显著的性能改进。