CVPRApr, 2021

基于音视频对应的自监督目标检测

TL;DR本文提出了一种基于音视频数据的无监督学习目标检测器的方法,采用自监督框架和对比目标优化设计,实现了不用监督方法到非常好的检测效果,还可以泛化扩展到包括乐器、飞机和猫等生活常见物体的检测。