- SIAVC:工业事故视频分类的半监督框架
提出了一种新的半监督学习方法 SIAVC,用于工业事故视频分类,通过视频增强和伪标签样本生成来改善半监督学习中标记和未标记训练数据的不平衡问题,并在构建的 ECA9 数据集上取得优异的视频分类性能。
- CVPRCUE-Net: 基于空间裁剪、增强统一器 V2 和改进的高效叠加注意力的暴力检测视频分析
本文提出了 CUE-Net,一种用于视频监控中自动化暴力检测的新型架构,并通过将空间裁剪与 UniformerV2 架构的增强版本相结合,集成了卷积和自注意机制以及一种新颖的修改的高效加性注意机制(减少了自注意力的二次时间复杂度),从而有效 - 揭示自我监督在多视角多人关联与跟踪中的作用
多视角多人联合追踪和跟踪(MvMHAT)是用于多人场景视频监视的新而重要的问题,旨在在每个视图中随时间追踪一群人,并在同一时间识别不同视图中的同一人,我们提出了一种自监督学习感知的端到端网络,利用了空间 - 时间自一致性的特性来解决这个问题 - 视频中以人为中心的行为描述:新的基准和模型
在视频监控领域中,描述每个个体的行为变得越来越重要,特别是在复杂场景中存在多个个体的情况下。为了解决此问题,我们构建了一个以人为中心的视频监控标题数据集,提供了 7,820 个个体的动态行为的详细描述,并且提出了一种新的视频标题方法,可以在 - 探索 CLIP 潜空间用于视频异常识别
我们介绍了一种名为 AnomalyCLIP 的新方法,它首次将大语言和视觉(LLV)模型(如 CLIP)与多实例学习相结合,用于联合视频异常检测和分类。我们通过操纵潜在的 CLIP 特征空间来识别正常事件子空间,并有效地学习文本驱动的异常事 - YOLORe-IDNet:一种用于个人追踪的高效多摄像头系统
通过结合相关滤波器和交并比(IOU)约束的人物追踪系统,以及基于 YOLOv5 的深度学习模型进行跨摄像头人员再识别,快速实时跟踪嫌疑人,适用于安全监控应用。
- ICARUS: 一种基于安卓的无人机(UAV)搜索和救援空中眼
本研究旨在开发一种使用四旋翼无人机进行监视和救援的功能样机,该样机具备视频监控能力、地图坐标定位功能、可投放药箱或食品包的降落伞、碰撞预警系统,并与安卓应用程序集成以辅助搜救行动。研究利用应用型研究方法开发功能样机,并使用定量和描述性统计方 - CA-CentripetalNet: 一种新的无锚点深度学习框架用于硬帽佩戴检测
提出了一种名为 CA-CentripetalNet 的新型无锚深度学习框架,用于自动检测建筑工地上的安全帽佩戴情况,并通过垂直 - 水平角池化和边界约束中心注意力两种方案来改进其特征提取和利用能力,实验证明 CA-CentripetalNe - 通过深度特征统计建模降低视频监控中的误报
通过基于深度特征的高维统计建模,以减少虚假报警的数量,提出了一种方法不可知的弱监督的 a-contrario 验证过程,并结合像素和对象级别的评估指标对六种方法和多个数据集中的序列进行了评估,实验证明该方法能够显著减少像素和对象级别上的虚假 - 可扩展的人机编码中的基层效率
本文研究了可扩展的人机编码中基础层的编码效率,发现与当前最佳结果相比,在目标检测和实例分割方面可以获得 20-40%的 BD-Rate 增益。
- 远视:一种物理驱动的大距离和高度全身生物特征识别系统
FarSight 是一款应用于视频监控的软件系统,可通过整合面部、步态和身体形态等信息,对全身生物识别进行端到端的设计、开发和评估,并使用深度学习模型和影像物理学相结合进行影像修复和生物特征编码,其测试结果较好。
- MMDroneNet:利用自我组织神经网络的异构无人机实现人群密度估计
本文针对公共场所的人群密度估计问题,提出了一种基于自组织神经网络和无人机的新型算法 DroneNet,应用了深度学习和卷积神经网络技术,结果表明该算法在等效 CNN 模型基础上性能更优。
- 视频监控场景下人脸识别方法的比较分析
该研究针对人脸识别中的关键问题:人脸检测、人脸对齐和人脸识别,通过在同一骨干架构下进行面部识别方法的比较基准测试,提出了最新的人脸识别状态,针对红外图像、无遮挡、带口罩、戴眼镜等情况对不同的识别算法进行了评估。
- 视频智能作为全球安保系统的一个组成部分
描述研究从视频分析到具有全球安全系统的演变,特别关注视频监视组件。本研究探讨了一种混合平台,用于智能辅助城市视频监视的智能捕获、自动化数据提取、监督机器学习;同时还讨论了拓展到全球安全系统的其他组件。
- CVPRUBnormal:用于监督式开放式视频异常检测的新基准
本文提出一种名为 UBnormal 的新型有监督开集基准测试,包括多个虚拟场景用于视频异常检测,将像素级异常事件标注添加到训练数据集中,允许完全有监督学习方法用于异常事件检测,同时维持典型的开集问题,并提供了良好的性能和实验证据支持。
- MM透过透视引导的分数膨胀卷积实现的人群计数
本文提出了一种名为 PFDNet 的卷积神经网络方法,通过使用分数膨胀卷积核来适应不同标注的透视变换,在处理视频监控场景下的人群计数时,显著提高了目前最先进的方法的灵活性和计算效率。
- MMCDN-MEDAL:双阶段密度与差值逼近框架用于运动分析
本文提出了一种名为 CDN-MEDAL-net 的新方法,使用两个卷积神经网络,其中第一个网络基于 GMM 统计学习策略,第二个网络实现了轻量级的在线视频背景减除,实验结果表明这种方法不仅能够在未见情况下有效地提取移动对象的区域,而且非常高 - ICCV利用弱监督的多尺度属性特定定位改善行人属性识别
提出适用于行人属性识别的属性定位模块 (ALM),以自适应方式发现最具有区分性的区域并学习每个属性的区域特征,并引入特征金字塔架构以实现低水平的属性特定局部化。
- ICCV视角混淆特征学习用于人员重识别
本文提出了一种名为 VCFL 的最新的 Person Re-ID across cameras 的可训练框架,该框架通过利用视图混淆学习机制来学习视图不变的特征,并结合了视图通用性和视图特定性的方法,并利用诸如分类器和特征中心等技术来实现视 - 可见光 - 红外跨模态人员再识别的高效框架
本论文提出了一种四流框架,通过深度卷积神经网络中不同的输入图像表示来学习不同的特征,从而改善可见光 - 红外人员重识别系统的性能。实验结果表明,该框架在多个数据集上优于当前最先进的方法。