跨摄像机兴趣区域优化：大规模高效实时视频分析

MMMay, 2021

跨摄像机兴趣区域优化：大规模高效实时视频分析

CrossRoI: Cross-camera Region of Interest Optimization for Efficient Real Time Video Analytics at Scale

Hongpeng Guo, Shuochao Yao, Zhe Yang, Qian Zhou, Klara Nahrstedt

TL;DRCrossRoI 是一种资源有效的系统，通过利用视频内容的关联性和冗余性在规模上实现实时视频分析，其中包括离线相位建立跨相机关系的决策，以及高效在线相位的实时视频推理，同时比基线方法具有更高的查询准确性和较高的性能收益。

Abstract

Video cameras are pervasively deployed in city scale for public good or community safety (i.e. traffic monitoring or suspected person tracking). However, analyzing large scale video feeds in real time is data intensive and poses severe challenges to network and computation systems today. We present CrossRoI, a →

real-time video analytics cross-camera correlation resource-efficient network overhead reduction response delay reduction

发现论文，激发创造

基于兴趣区域（ROI）的自适应跨层实时视频流传输系统用于车载自组织网络（VANETs）

提出了在车辆环境中通过提高端到端视频传输质量来加强车辆应用中对视频获取和处理的依赖的算法。通过在 IEEE 802.11p MAC 层应用感兴趣区域 (ROI) 视觉数据包的自适应跨层映射，优先处理基于驾驶环境感知的场景 ROI 部分。在实际 VANET 仿真结果中，对于 HEVC 压缩视频通信，提出的系统在 ROI 部分提供了高达 11dB 的峰值信噪比增益。

Nov, 2023

自动感兴趣区域车辆计数与行车轨迹检测

该论文介绍了一种从交通录像中对车辆进行计数的方法，自动识别相机的 ROI 和车辆的行驶轨迹，并能够应用于常用于发展中国家的 Pan-Tilt-Zoom 相机，取得了良好的测试结果。

Aug, 2021

跨物体感知的非局部 RoI

本研究提出了一种新的模块 ——NL-RoI，该模块能够将感兴趣区域（RoI）表示为其内在特征和与其他 RoI 的外在关系，进而用于图像检测和分割任务，并在实验中取得了较好的表现。

Nov, 2018

基于 ROI 的 Swin Transformers 深度图像压缩

本文提出了一种利用 Swin transformer 作为自编码器网络的主要构建模块，将二进制 ROI 掩模集成到不同层的网络中，以提供空间信息指导。实验结果表明，这种模型在 ROI PSNR 方面优于其他方法，在 COOCO 验证集上具有更好的目标检测和实例分割性能。

May, 2023

视频对象识别的时态 RoI Align

在视频物体检测中，使用提取视频中当前帧之前的帧中的信息对当前帧进行检测以提取时序信息是一种自然的选择，本文提出了一种基于特征相似性的新型 Temporal RoI Align 算子，用于从当前视频中的其它帧特征图中提取与当前帧相似的结果，能够提取整个视频的时序信息，并将其整合到单帧视频检测器和其他现有视频检测器中，经定量实验表明，所提出的 Temporal RoI Align 算子可以显著提高检测性能。

Sep, 2021

面向害虫图像识别的 ROI 感知多尺度交叉注意力视觉变换器

在这篇论文中，我们提出了一种新颖的 ROI 视觉转换方法（ROI-ViT），通过多尺度交叉注意力融合生成和更新感兴趣区域（ROIs），从而解决了识别有害生物时的复杂背景和尺度问题，实验结果表明该方法相比其他先进模型表现更好，特别是在具有复杂背景和小尺寸的新数据集上保持了高的识别准确率。

Dec, 2023

语义感知的不变转换 RoI Align

在这篇论文中，我们提出了一种新颖的 RoI 特征提取器 Semantic RoI Align（SRA），它能够在各种变换下提取不变的 RoI 特征，用于两阶段检测器。我们通过引入语义注意力模块，利用 RoI 内的全局和局部语义关系自适应地确定不同采样区域。我们还提出了动态特征采样器 Dynamic Feature Sampler，根据 RoI 的宽高比动态采样特征，以提高 SRA 的效率。另外，我们引入了一种新的位置嵌入 Area Embedding，通过改进采样区域表示提供更准确的位置信息给 SRA。实验证明，我们的模型在比基准模型轻微计算开销的情况下显著优于其他模型，并具有出色的泛化能力，可以改善各种最先进的主干网络和检测方法的性能。

Dec, 2023

分布式智能摄像头上的视频分析实现跨摄像头协作

本研究提出了一个跨相机协作的分布式视频分析系统 Argus，通过利用物体的时空关联，在多个相机的重叠视野中避免冗余的处理任务，动态排序相机和对象检查序列，并灵活分配工作负载，实现低延迟的分布式处理。该系统在三个真实世界的重叠相机数据集上的评估结果显示，相对于现有技术，Argus 可以将对象标识的数量和端到端延迟分别减少多达 7.13 倍和 2.19 倍（相对于现有技术，分别减少了 4.86 倍和 1.60 倍），同时实现可比较的跟踪质量。

Jan, 2024

用于匿名学习图像压缩的感兴趣区域损失

在公共空间使用人工智能不断引发对隐私和敏感数据保护的担忧，本论文介绍了一种使用定制损失函数的 ROI 来实现足够去识别化的方法，通过训练端到端优化的自编码器来实现压缩和去识别化，同时考虑了压缩率、延迟和对人脸和人物检测模型的影响。

Jun, 2024

最佳感兴趣区域下的实时车道交通监控

这篇论文介绍了一种新型系统，可以自动从高速公路摄像头视频中学习车道位置和交通方向，收集实时、针对车道的交通数据，以实现高效的交通分析和决策，提高高速公路安全性。

Mar, 2024