Apr, 2021

多视角伪标记用于视频半监督学习

TL;DR我们提出了一种多视角伪标记方法来进行视频学习,它利用外观和运动信息的互补视角进行半监督学习,以获取更可靠的伪标签并比纯监督数据学习更强的视频表示。我们的方法在多个视频识别数据集上大大优于其监督对应方法,并在自监督视频表示学习的标准基准测试中与先前的工作相比具有竞争优势,同时仍然训练一个共享外观和运动输入的模型,因此在推理时间不会产生额外的计算开销。