利用未标记视频对来自未见过的类别的对象进行更好的分割学习
本文提出一种基于弱监督学习的目标检测和检索方法,通过对视频进行自然主体提取,使用对比采样处理背景拒绝,使用聚类评分算法解决高噪声标签问题,针对 11 个手动标注目标在 5000 帧中的评估结果与弱监督方法进行比较并提供上限参考。
May, 2019
本文提出了第一个完全无监督的方法,用于在真实场景的序列中分割多个对象,通过空间绑定对象并将这些槽联系起来,在高级语义特征空间中重建中间帧,解决了效率和规范化问题,成功地在 YouTube 视频中分割了复杂且多变的类别的多个实例。
Oct, 2023
提出了一种利用无标注视频进行物体模式学习的视频对象分割新方法,通过引入统一的无监督 / 弱监督学习框架,可以全面捕捉 VOS 的内在特性,在不同的 VOS 设置中表现出有希望的性能并显著减少标注负担。
Mar, 2020
本研究致力于解决视觉数据无监督学习中的目标检测问题,使用包含深度神经网络的学生路径来训练模型,该模型可以在测试时明显优于无监督视频发现教师,并在 YouTube 视频数据集和目标发现数据集等基准测试中取得了最先进的结果,测试时比其他方法至少快两个数量级。
Mar, 2017
通过在未标注的视频序列和额外图像上使用半监督学习,结合人工标注标签和伪标签数据进行训练,该简单而有效的迭代半监督学习方法在城市街景分割任务上取得了 67.8%的 PQ,42.6%的 AP 和 85.2%的 mIOU 的最优成果,并在核心计算机视觉任务上实现了超越最先进水平的重要进展。
May, 2020
该论文提出了一个自超视自学的物体分割系统,其训练过程利用了点云的超分割结果,利用图匹配算法和点云配准结合检测出 3D 假标签上的再现物体模式并生成 2D 掩码。实验证明,该方法在真实和合成的视频数据集上的表现优于现有的无监督方法。
Apr, 2023
我们提出了仅从未标记视频中学习的 Mobile Object Detector(MOD-UV),它可以在单张静态图像中检测和分割移动对象,并且在 Waymo Open、nuScenes 和 KITTI 数据集上实现了最先进的无监督移动对象检测性能,而不使用任何外部数据或有监督模型。
May, 2024
本文提出基于视频序列的目标发现和检测器适应方法,通过三个大型自动驾驶和移动机器人场景的视频数据集的应用,证明了其鲁棒性和广泛性,并提出了一种基于外观聚类的无监督物体发现方法,成功地发现了与驾驶场景相关的有趣物体,同时通过自监督检测器适应,进一步提高了现有类别在 KITTI 数据集的检测性能,可用于自主驾驶的大规模目标学习。
Dec, 2017