本文提出一种半监督的方法,用于在长视频中定位多个未知的物体实例,通过这种方法可以有效地进行对象检测和跟踪,同时实现对大量静态物体实例的识别。
May, 2015
通过开发一种名为AC-CNN的新型神经网络模型,将全局和局部上下文信息有效地结合到区域卷积神经网络中,提高了目标检测性能,特别是在PASCAL VOC 2007和VOC 2012数据集上,与目前主流的Fast-RCNN算法相比在mAP方面分别提高了2.0%和2.2%
Mar, 2016
本论文涉及基于区域的检测器,使用卷积网络实现高效的物体检测,使用位置敏感的得分图解决分类中的平移不变性和物体检测中的平移可变性的问题,可自然地采用全卷积图像分类器骨干网进行物体检测,以101层残差网络(ResNet)在PASCAL VOC数据集上取得83.6%mAP的竞争性结果,测试时间为每张图像170ms,比Faster R-CNN快2.5-20倍。
May, 2016
本文提出了一种新的空间监督递归卷积神经网络,用于视觉对象跟踪,通过研究长短期记忆和区域信息的回归能力,结合卷积网络产生的高层视觉特征直接预测跟踪位置,相较于现有的深度学习跟踪器,我们的跟踪器在保持低计算成本的同时更加准确和鲁棒,实验结果表明在多个数据集上均表现优异,常常优于排名第二的跟踪器。
Jul, 2016
本研究致力于解决视觉数据无监督学习中的目标检测问题,使用包含深度神经网络的学生路径来训练模型,该模型可以在测试时明显优于无监督视频发现教师,并在 YouTube 视频数据集和目标发现数据集等基准测试中取得了最先进的结果,测试时比其他方法至少快两个数量级。
Mar, 2017
本文回顾了基于深度学习的目标检测框架,从深度学习和卷积神经网络教程开始,介绍了典型的通用和特定目标检测架构以及改进方法和技巧,并提供了实验数据分析,最后提出了未来研究中的几个有前景的方向和任务。
Jul, 2018
本文提出了一种通过操作相关数字分布的统计卷积神经网络(SCNN)来处理多帧相关图像的方法,实现了显著的速度提升,即使在未经优化的情况下,仍然能实现高达178%的加速。
Mar, 2019
本文提出一种基于弱监督学习的目标检测和检索方法,通过对视频进行自然主体提取,使用对比采样处理背景拒绝,使用聚类评分算法解决高噪声标签问题,针对11个手动标注目标在5000帧中的评估结果与弱监督方法进行比较并提供上限参考。
May, 2019
该研究提出了一种实例感知和以上下文为中心的统一框架,采用实例感知自训练算法和可学习Concrete DropBlock,同时设计了一种内存高效的顺序批次反向传播。该方法在COCO、VOC2007和VOC2012数据集上取得了最先进的结果,并且是第一个基于ResNet的研究,还进行了弱监督视频目标检测的基准测试。
Apr, 2020
通过利用视频的动态运动特性,我们引入了SSVOD,一个端到端的半监督视频目标检测框架,以利用大规模未标记的帧和稀疏注释来选择性地组装鲁棒的伪标签,并通过结合硬伪标签和软伪标签的置信度阈值进行伪标签的确认偏见和不确定性噪声的平衡,从而在ImageNet-VID,Epic-KITCHENS和YouTube-VIS数据集上实现了显著的性能改进。
Sep, 2023