跨摄像机兴趣区域优化:大规模高效实时视频分析
提出了在车辆环境中通过提高端到端视频传输质量来加强车辆应用中对视频获取和处理的依赖的算法。通过在 IEEE 802.11p MAC 层应用感兴趣区域 (ROI) 视觉数据包的自适应跨层映射,优先处理基于驾驶环境感知的场景 ROI 部分。在实际 VANET 仿真结果中,对于 HEVC 压缩视频通信,提出的系统在 ROI 部分提供了高达 11dB 的峰值信噪比增益。
Nov, 2023
该论文介绍了一种从交通录像中对车辆进行计数的方法,自动识别相机的 ROI 和车辆的行驶轨迹,并能够应用于常用于发展中国家的 Pan-Tilt-Zoom 相机,取得了良好的测试结果。
Aug, 2021
本研究提出了一种新的模块 ——NL-RoI,该模块能够将感兴趣区域(RoI)表示为其内在特征和与其他 RoI 的外在关系,进而用于图像检测和分割任务,并在实验中取得了较好的表现。
Nov, 2018
本文提出了一种利用 Swin transformer 作为自编码器网络的主要构建模块,将二进制 ROI 掩模集成到不同层的网络中,以提供空间信息指导。实验结果表明,这种模型在 ROI PSNR 方面优于其他方法,在 COOCO 验证集上具有更好的目标检测和实例分割性能。
May, 2023
在视频物体检测中,使用提取视频中当前帧之前的帧中的信息对当前帧进行检测以提取时序信息是一种自然的选择,本文提出了一种基于特征相似性的新型 Temporal RoI Align 算子,用于从当前视频中的其它帧特征图中提取与当前帧相似的结果,能够提取整个视频的时序信息,并将其整合到单帧视频检测器和其他现有视频检测器中,经定量实验表明,所提出的 Temporal RoI Align 算子可以显著提高检测性能。
Sep, 2021
在这篇论文中,我们提出了一种新颖的 ROI 视觉转换方法(ROI-ViT),通过多尺度交叉注意力融合生成和更新感兴趣区域(ROIs),从而解决了识别有害生物时的复杂背景和尺度问题,实验结果表明该方法相比其他先进模型表现更好,特别是在具有复杂背景和小尺寸的新数据集上保持了高的识别准确率。
Dec, 2023
在这篇论文中,我们提出了一种新颖的 RoI 特征提取器 Semantic RoI Align(SRA),它能够在各种变换下提取不变的 RoI 特征,用于两阶段检测器。我们通过引入语义注意力模块,利用 RoI 内的全局和局部语义关系自适应地确定不同采样区域。我们还提出了动态特征采样器 Dynamic Feature Sampler,根据 RoI 的宽高比动态采样特征,以提高 SRA 的效率。另外,我们引入了一种新的位置嵌入 Area Embedding,通过改进采样区域表示提供更准确的位置信息给 SRA。实验证明,我们的模型在比基准模型轻微计算开销的情况下显著优于其他模型,并具有出色的泛化能力,可以改善各种最先进的主干网络和检测方法的性能。
Dec, 2023
本研究提出了一个跨相机协作的分布式视频分析系统 Argus,通过利用物体的时空关联,在多个相机的重叠视野中避免冗余的处理任务,动态排序相机和对象检查序列,并灵活分配工作负载,实现低延迟的分布式处理。该系统在三个真实世界的重叠相机数据集上的评估结果显示,相对于现有技术,Argus 可以将对象标识的数量和端到端延迟分别减少多达 7.13 倍和 2.19 倍(相对于现有技术,分别减少了 4.86 倍和 1.60 倍),同时实现可比较的跟踪质量。
Jan, 2024
在公共空间使用人工智能不断引发对隐私和敏感数据保护的担忧,本论文介绍了一种使用定制损失函数的 ROI 来实现足够去识别化的方法,通过训练端到端优化的自编码器来实现压缩和去识别化,同时考虑了压缩率、延迟和对人脸和人物检测模型的影响。
Jun, 2024
这篇论文介绍了一种新型系统,可以自动从高速公路摄像头视频中学习车道位置和交通方向,收集实时、针对车道的交通数据,以实现高效的交通分析和决策,提高高速公路安全性。
Mar, 2024