跨物体感知的非局部 RoI

NIPSNov, 2018

Non-local RoI for Cross-Object Perception

Shou-Yao Roy Tseng, Hwann-Tzong Chen, Shao-Heng Tai, Tyng-Luh Liu

TL;DR本研究提出了一种新的模块 ——NL-RoI，该模块能够将感兴趣区域（RoI）表示为其内在特征和与其他 RoI 的外在关系，进而用于图像检测和分割任务，并在实验中取得了较好的表现。

Abstract

We present a generic and flexible module that encodes region proposals by both their intrinsic features and the extrinsic correlations to the others. The proposed non-local region of interest (NL-RoI) can be seamlessly adapted into different generalized r-cnn architectures to better ad

region proposal non-local region of interest (nl-roi)r-cnn architectures detection segmentation

发现论文，激发创造

一种新的感兴趣区域提取层，用于实例分割

本文旨在提供一个新的通用 RoI 提取器 ——GRoIE，它引入非局部模块和注意机制来提高性能。综合组件级的消融研究，找到了 GRoIE 层的最佳算法和参数集。该提取器能够无缝地集成在各种二阶段架构中，为目标检测和实例分割任务带来显著 1.1% 的 AP 提高。

Apr, 2020

学习区域特征进行目标检测

提出了一个更统一而可学习的区域特征提取方法，它消除了大部分启发式选择，并且在性能上优于现有的基于 RoI pooling 的方法。

Mar, 2018

跨摄像机兴趣区域优化：大规模高效实时视频分析

CrossRoI 是一种资源有效的系统，通过利用视频内容的关联性和冗余性在规模上实现实时视频分析，其中包括离线相位建立跨相机关系的决策，以及高效在线相位的实时视频推理，同时比基线方法具有更高的查询准确性和较高的性能收益。

May, 2021

语义感知的不变转换 RoI Align

在这篇论文中，我们提出了一种新颖的 RoI 特征提取器 Semantic RoI Align（SRA），它能够在各种变换下提取不变的 RoI 特征，用于两阶段检测器。我们通过引入语义注意力模块，利用 RoI 内的全局和局部语义关系自适应地确定不同采样区域。我们还提出了动态特征采样器 Dynamic Feature Sampler，根据 RoI 的宽高比动态采样特征，以提高 SRA 的效率。另外，我们引入了一种新的位置嵌入 Area Embedding，通过改进采样区域表示提供更准确的位置信息给 SRA。实验证明，我们的模型在比基准模型轻微计算开销的情况下显著优于其他模型，并具有出色的泛化能力，可以改善各种最先进的主干网络和检测方法的性能。

Dec, 2023

自动上下文区域卷积神经网络

本文提出了一种自适应挖掘周边上下文信息的 RoI 运算符，并将其无缝集成到 R-CNN 中，形成了一种端到端训练的物体检测系统，称为自上下文 R-CNN。在 Pascal VOC、Microsoft COCO 和 KITTI 数据集上进行了实验，结果证明该方法在鲁棒性、鲁棒性和对抗攻击方面均表现良好。

Jul, 2018

CoupleNet：将全局结构与局部部分相结合用于目标检测

本研究提出了一种名为 CoupleNet 的新型全卷积网络，通过耦合全局结构与局部部分进行目标检测，其中一个分支采用位置敏感 RoI 池化来捕获对象的局部信息，而另一个分支则采用 RoI 池化来对全局和上下文信息进行编码。实验证明该方法具有良好的效果。

Aug, 2017

视频对象识别的时态 RoI Align

在视频物体检测中，使用提取视频中当前帧之前的帧中的信息对当前帧进行检测以提取时序信息是一种自然的选择，本文提出了一种基于特征相似性的新型 Temporal RoI Align 算子，用于从当前视频中的其它帧特征图中提取与当前帧相似的结果，能够提取整个视频的时序信息，并将其整合到单帧视频检测器和其他现有视频检测器中，经定量实验表明，所提出的 Temporal RoI Align 算子可以显著提高检测性能。

Sep, 2021

面向特定对象检索的上下文感知查询图像表示

通过人类视觉传递的信息流作为灵感，提出了一种基于 CNN 的特定目标检索方法，将注意力放在感兴趣的区域上可以显著提高检索的准确性，并且使用新颖的显着性度量对区域进行加权，进一步提高了检索的准确性。

Mar, 2017

基于 ROI 的 Swin Transformers 深度图像压缩

本文提出了一种利用 Swin transformer 作为自编码器网络的主要构建模块，将二进制 ROI 掩模集成到不同层的网络中，以提供空间信息指导。实验结果表明，这种模型在 ROI PSNR 方面优于其他方法，在 COOCO 验证集上具有更好的目标检测和实例分割性能。

May, 2023

用于图像恢复的非局部循环网络

本文提出了一种非局部递归网络（NLRN），将非局部操作纳入递归神经网络（RNN）用于图像恢复，在图像去噪和超分辨率任务中，该模型由于递归非局部操作和相关性传播而取得了优越的结果。

Jun, 2018