视频目标检测的鲁棒高效后处理

Sep, 2020

Robust and efficient post-processing for video object detection

Alberto Sabater, Luis Montesano, Ana C. Murillo

TL;DR本文提出了一种基于学习相似度评估的后处理方法，它可以克服先前后处理方法的一些局限性，提高特定视频检测器的结果，特别是在快速运动物体方面，并具有低资源要求。该方法还可以应用于像 YOLO 这样的高效静态图像检测器，提供与计算量更大的检测器相当的结果。

Abstract

object recognition in video is an important task for plenty of applications, including autonomous driving perception, surveillance tasks, wearable devices or IoT networks. →

object recognition video post-processing learning-based similarity evaluation efficiency

发现论文，激发创造

高性能视频目标检测

本文探讨了基于多帧端到端学习特征和帧间运动的统一方法，该方法扩展了之前的研究并引入了三个新技术来提高视频物体检测性能。

Nov, 2017

基于序列非极大值抑制的视频目标检测

本文将视觉目标检测中的三个阶段进行了修改，采用了从相邻帧提取高得分目标检测的方法来增强同一剪辑中弱目标检测的得分，并获得了比现有技术更好的结果。该方法在 ImageNet 大规模视觉识别挑战赛 2015 年的视频目标检测（VID）任务中取得了第三名。

Feb, 2016

物体不消失：通过单帧物体位置预测的视频物体检测

通过利用连续平滑的运动，我们在三个方面进行了改进：1）通过将对象运动作为额外的监督来源，从静态关键帧中预测对象位置来提高准确性。2）通过仅在少量帧中进行昂贵的特征计算来提高效率。3）通过仅注释关键帧并利用关键帧之间的平滑伪运动来减少注释成本。我们在四个数据集上展示了计算效率、注释效率和改进的均值平均精度，分别是 ImageNet VID，EPIC KITCHENS-55，YouTube-BoundingBoxes 和 Waymo Open dataset。我们的源代码可在此 https URL 找到。

Aug, 2023

利用深度学习在遮挡环境和背景杂乱效果中进行实时物体检测

通过改进检测精度、减少模型面临的问题以及应用数据增强、噪声降低、参数优化和模型融合等技术，我们提出了一种针对混杂背景、遮挡环境中实时检测汽车和坦克的深度学习模型。SSD-Mobilenet v2 模型的准确率和帧数优于 YOLO V3 和 YOLO V4，我们通过引入数据增强、噪声降低、参数优化和模型融合等技术进一步提高检测和识别的效果，并对检测方式进行了统计，属性实验比较，并实现了一个具有物体计数、警报、状态、分辨率以及帧数等功能的图形用户界面系统。该方法的实施得到了 YOLO V3、V4 和 SSD 分析的确认，以完成提出的方法。

Jan, 2024

隐私保护的视频物体检测用于重症监护病房的患者监控

本文提出了一种新方法，利用视频帧的时间连续性，通过重新分配图像色彩通道来改善病人监测中出现的假象对监测数据的影响，从而实现病人监测的自动化和信息化。

Jun, 2023

利用 YOLO-v7 特征提高 VVC 编码视频的物体检测精度

本文提出了一种基于神经网络的方法，通过对编码后的视频进行后处理来提高图像识别准确性，尤其是物体检测准确性，可使用最新的视频编码方法 VVC 和最新的物体检测模型 YOLO-v7，即使在低比特率下也可以实现高的物体检测准确度。

Apr, 2023

利用物体检测和口头反馈帮助盲人

本研究使用 YOLO 模型和 OpenCV 库，利用实时视频检测对象并将图像识别结果以可听形式提供给视觉障碍者，成功实现了优秀的平均准确率 (mAP)。

Dec, 2023

实时深度学习车辆和行人检测与分析

通过训练和评估 YOLOv8 和 RT-DETR 模型的不同版本，我们的研究项目旨在创建和验证一个先进的深度学习框架，能够处理复杂视觉输入，以实时识别各种环境中的汽车和行人。YOLOv8 Large 版本被证明是最有效的，在行人识别方面具有很高的准确性和鲁棒性。研究结果表明，该模型能够显著提高交通监控和安全性，成为计算机视觉领域实时可靠检测的重要贡献，并为交通管理系统建立了新的基准。

Apr, 2024

利用时间一致性进行高效的单阶段视频目标检测

我们提出了一个简单而高效的框架，通过利用视频帧中的时间一致性来解决计算上的瓶颈，从而实现了具有高效性的单阶段视频目标检测。

Feb, 2024

基于匹配的视频对象分割：VideoMatch

该研究提出了一种基于匹配的视频目标分割算法，在不需要 fine-tuning 的情况下实现了实时性和较短的计算时间。

Sep, 2018