视频目标检测的鲁棒高效后处理
本文将视觉目标检测中的三个阶段进行了修改,采用了从相邻帧提取高得分目标检测的方法来增强同一剪辑中弱目标检测的得分,并获得了比现有技术更好的结果。该方法在 ImageNet 大规模视觉识别挑战赛 2015 年的视频目标检测(VID)任务中取得了第三名。
Feb, 2016
通过利用连续平滑的运动,我们在三个方面进行了改进:1)通过将对象运动作为额外的监督来源,从静态关键帧中预测对象位置来提高准确性。2)通过仅在少量帧中进行昂贵的特征计算来提高效率。3)通过仅注释关键帧并利用关键帧之间的平滑伪运动来减少注释成本。我们在四个数据集上展示了计算效率、注释效率和改进的均值平均精度,分别是 ImageNet VID,EPIC KITCHENS-55,YouTube-BoundingBoxes 和 Waymo Open dataset。我们的源代码可在此 https URL 找到。
Aug, 2023
通过改进检测精度、减少模型面临的问题以及应用数据增强、噪声降低、参数优化和模型融合等技术,我们提出了一种针对混杂背景、遮挡环境中实时检测汽车和坦克的深度学习模型。SSD-Mobilenet v2 模型的准确率和帧数优于 YOLO V3 和 YOLO V4,我们通过引入数据增强、噪声降低、参数优化和模型融合等技术进一步提高检测和识别的效果,并对检测方式进行了统计,属性实验比较,并实现了一个具有物体计数、警报、状态、分辨率以及帧数等功能的图形用户界面系统。该方法的实施得到了 YOLO V3、V4 和 SSD 分析的确认,以完成提出的方法。
Jan, 2024
本文提出了一种新方法,利用视频帧的时间连续性,通过重新分配图像色彩通道来改善病人监测中出现的假象对监测数据的影响,从而实现病人监测的自动化和信息化。
Jun, 2023
本文提出了一种基于神经网络的方法,通过对编码后的视频进行后处理来提高图像识别准确性,尤其是物体检测准确性,可使用最新的视频编码方法 VVC 和最新的物体检测模型 YOLO-v7,即使在低比特率下也可以实现高的物体检测准确度。
Apr, 2023
本研究使用 YOLO 模型和 OpenCV 库,利用实时视频检测对象并将图像识别结果以可听形式提供给视觉障碍者,成功实现了优秀的平均准确率 (mAP)。
Dec, 2023
通过训练和评估 YOLOv8 和 RT-DETR 模型的不同版本,我们的研究项目旨在创建和验证一个先进的深度学习框架,能够处理复杂视觉输入,以实时识别各种环境中的汽车和行人。YOLOv8 Large 版本被证明是最有效的,在行人识别方面具有很高的准确性和鲁棒性。研究结果表明,该模型能够显著提高交通监控和安全性,成为计算机视觉领域实时可靠检测的重要贡献,并为交通管理系统建立了新的基准。
Apr, 2024