高性能视频目标检测
本文提出了一种基于学习相似度评估的后处理方法,它可以克服先前后处理方法的一些局限性,提高特定视频检测器的结果,特别是在快速运动物体方面,并具有低资源要求。该方法还可以应用于像 YOLO 这样的高效静态图像检测器,提供与计算量更大的检测器相当的结果。
Sep, 2020
本文将视觉目标检测中的三个阶段进行了修改,采用了从相邻帧提取高得分目标检测的方法来增强同一剪辑中弱目标检测的得分,并获得了比现有技术更好的结果。该方法在 ImageNet 大规模视觉识别挑战赛 2015 年的视频目标检测(VID)任务中取得了第三名。
Feb, 2016
通过利用连续平滑的运动,我们在三个方面进行了改进:1)通过将对象运动作为额外的监督来源,从静态关键帧中预测对象位置来提高准确性。2)通过仅在少量帧中进行昂贵的特征计算来提高效率。3)通过仅注释关键帧并利用关键帧之间的平滑伪运动来减少注释成本。我们在四个数据集上展示了计算效率、注释效率和改进的均值平均精度,分别是 ImageNet VID,EPIC KITCHENS-55,YouTube-BoundingBoxes 和 Waymo Open dataset。我们的源代码可在此 https URL 找到。
Aug, 2023
该论文提出了一种用于视频中物体分割的方法,结合了帧级物体检测与物体跟踪、运动分割等概念,提取了基于现成检测器的时间一致性物体管,结合运动线索提供视频分割,克服了弱监督 / 无监督视频分割的典型问题,并提供每个对象的精确、时间一致的分割。
Aug, 2016
该研究提出了一种基于流引导特征聚合的视频物体检测学习框架,该框架通过沿着运动路径聚合邻近特征来提高视频的识别精度,避免了视频中物体外观退化的问题,并且完全可训练,与 ImageNet VID 挑战的最佳工程系统相当
Mar, 2017
本文回顾了基于深度学习的目标检测框架,从深度学习和卷积神经网络教程开始,介绍了典型的通用和特定目标检测架构以及改进方法和技巧,并提供了实验数据分析,最后提出了未来研究中的几个有前景的方向和任务。
Jul, 2018
本论文介绍了一个基于静态图像物体侦测和一般物体跟踪的完整视频目标侦测框架,并提出了一个时间卷积网络来整合时间信息以规范化侦测结果,在 ImageNet 数据集上进行了评估。
Apr, 2016
本文提出了一种名为 Impression Network 的视频物体检测框架,它通过迭代地融合可以提取的稀疏帧特征,创建一种名为 'impression feature' 的自然高效特征聚合机制,在提高速度的同时,获得了比现有方法更高的准确性。
Dec, 2017
本研究介绍了一种新的视频目标检测方法,采用时序上下文方法来链接同一对象,从而提高分类准确率。该方法在 ImageNet VID 数据集上的表现优于静态图像检测器和先前的最新技术。
Jan, 2018