从未标注的视频中学习对象检测与检索
本文提出基于视频序列的目标发现和检测器适应方法,通过三个大型自动驾驶和移动机器人场景的视频数据集的应用,证明了其鲁棒性和广泛性,并提出了一种基于外观聚类的无监督物体发现方法,成功地发现了与驾驶场景相关的有趣物体,同时通过自监督检测器适应,进一步提高了现有类别在 KITTI 数据集的检测性能,可用于自主驾驶的大规模目标学习。
Dec, 2017
本文提出了基于新型弱标注的视频显著目标检测模型,并使用外观运动融合模块和双向 ConvLSTM 框架来实现有效的多模态学习和长期时序建模,还设计了一种前景背景相似度损失和一种弱标注增强策略,以提高模型性能和伪标签生成技术。在六个基准视频显著性检测数据集上的实验结果证明了我们方案的有效性。
Apr, 2021
该篇论文提出了一种从未加工过的视频中学习图像表示的方法,该方法将来自现成物体检测器的监督损失和自我监督损失相结合,取得了在 19 个迁移学习任务中有竞争力的结果,其中包括 18/19 的少样本学习任务和 8/8 的数据集泛化任务。
Oct, 2020
本文提出了一种基于音视频数据的无监督学习目标检测器的方法,采用自监督框架和对比目标优化设计,实现了不用监督方法到非常好的检测效果,还可以泛化扩展到包括乐器、飞机和猫等生活常见物体的检测。
Apr, 2021
本文探索使用未标注的视频序列自动生成未知类别对象的训练数据,介绍了一种基于贝叶斯方法的自动创建训练集的方法,并通过实验证明其能够显著提高分割未知类别对象的性能,从而可以利用丰富的互联网视频实现开放世界的实例分割。
Apr, 2021
本文提出了一种适用于移动摄像头、自适应于不同数据源的无监督多任务自学习算法,通过结合性地学习实例级追踪器,由此获得调整后的类别级物体检测器。
Jun, 2014
本研究介绍了一种从未标记的视频中进行无监督学习的新方法,通过引入一种面向物体的时间相干性方法来促进学习具有相似表征的物体,并在多个基准数据集上展示了与竞争无监督方法相比显著的准确度提高。
Dec, 2016
我们提出了一种通过无监督 / 自监督学习训练单阶段目标检测器的创新方法,该方法有潜力彻底改变标注过程,大大减少人工标注所需的时间和成本,并为之前难以实现的研究机会铺平了道路。与现有的主要针对分类任务的无监督学习方法不同,我们的方法承担了目标检测的独特挑战,开创了 intra-image 对比学习与 inter-image 对应的概念,能够获取目标检测所需的重要位置信息。该方法熟练地学习和表示这些位置信息,并生成信息丰富的热图。我们的结果展示了 89.2% 的卓越准确率,在计算机视觉领域的无监督目标检测领域突破性地提高了 15 倍,相比随机初始化。
Feb, 2024