高性能视频目标检测

Nov, 2017

Towards High Performance Video Object Detection

Xizhou Zhu, Jifeng Dai, Lu Yuan, Yichen Wei

TL;DR本文探讨了基于多帧端到端学习特征和帧间运动的统一方法，该方法扩展了之前的研究并引入了三个新技术来提高视频物体检测性能。

Abstract

There has been significant progresses for image object detection in recent years. Nevertheless, video object detection has received little attention, although it is more challenging and more important in practical scenarios. Built upon the recent works, this work proposes a

video object detection end-to-end learning cross-frame motion performance envelope unified approach

发现论文，激发创造

视频目标检测的鲁棒高效后处理

本文提出了一种基于学习相似度评估的后处理方法，它可以克服先前后处理方法的一些局限性，提高特定视频检测器的结果，特别是在快速运动物体方面，并具有低资源要求。该方法还可以应用于像 YOLO 这样的高效静态图像检测器，提供与计算量更大的检测器相当的结果。

Sep, 2020

基于序列非极大值抑制的视频目标检测

本文将视觉目标检测中的三个阶段进行了修改，采用了从相邻帧提取高得分目标检测的方法来增强同一剪辑中弱目标检测的得分，并获得了比现有技术更好的结果。该方法在 ImageNet 大规模视觉识别挑战赛 2015 年的视频目标检测（VID）任务中取得了第三名。

Feb, 2016

物体不消失：通过单帧物体位置预测的视频物体检测

通过利用连续平滑的运动，我们在三个方面进行了改进：1）通过将对象运动作为额外的监督来源，从静态关键帧中预测对象位置来提高准确性。2）通过仅在少量帧中进行昂贵的特征计算来提高效率。3）通过仅注释关键帧并利用关键帧之间的平滑伪运动来减少注释成本。我们在四个数据集上展示了计算效率、注释效率和改进的均值平均精度，分别是 ImageNet VID，EPIC KITCHENS-55，YouTube-BoundingBoxes 和 Waymo Open dataset。我们的源代码可在此 https URL 找到。

Aug, 2023

物体级别视频分割的物体检测、跟踪和运动分割

该论文提出了一种用于视频中物体分割的方法，结合了帧级物体检测与物体跟踪、运动分割等概念，提取了基于现成检测器的时间一致性物体管，结合运动线索提供视频分割，克服了弱监督 / 无监督视频分割的典型问题，并提供每个对象的精确、时间一致的分割。

Aug, 2016

基于流引导的视频目标检测特征聚合

该研究提出了一种基于流引导特征聚合的视频物体检测学习框架，该框架通过沿着运动路径聚合邻近特征来提高视频的识别精度，避免了视频中物体外观退化的问题，并且完全可训练，与 ImageNet VID 挑战的最佳工程系统相当

Mar, 2017

深度学习中的目标检测综述

本文回顾了基于深度学习的目标检测框架，从深度学习和卷积神经网络教程开始，介绍了典型的通用和特定目标检测架构以及改进方法和技巧，并提供了实验数据分析，最后提出了未来研究中的几个有前景的方向和任务。

Jul, 2018

使用卷积神经网络从视频管道中进行目标检测

本论文介绍了一个基于静态图像物体侦测和一般物体跟踪的完整视频目标侦测框架，并提出了一个时间卷积网络来整合时间信息以规范化侦测结果，在 ImageNet 数据集上进行了评估。

Apr, 2016

利用时间一致性进行高效的单阶段视频目标检测

我们提出了一个简单而高效的框架，通过利用视频帧中的时间一致性来解决计算上的瓶颈，从而实现了具有高效性的单阶段视频目标检测。

Feb, 2024

视频物体检测的印象网络

本文提出了一种名为 Impression Network 的视频物体检测框架，它通过迭代地融合可以提取的稀疏帧特征，创建一种名为 'impression feature' 的自然高效特征聚合机制，在提高速度的同时，获得了比现有方法更高的准确性。

Dec, 2017

高质量物体链接的视频目标检测

本研究介绍了一种新的视频目标检测方法，采用时序上下文方法来链接同一对象，从而提高分类准确率。该方法在 ImageNet VID 数据集上的表现优于静态图像检测器和先前的最新技术。

Jan, 2018