跨物体感知的非局部 RoI
本文旨在提供一个新的通用 RoI 提取器 ——GRoIE,它引入非局部模块和注意机制来提高性能。综合组件级的消融研究,找到了 GRoIE 层的最佳算法和参数集。该提取器能够无缝地集成在各种二阶段架构中,为目标检测和实例分割任务带来显著 1.1% 的 AP 提高。
Apr, 2020
CrossRoI 是一种资源有效的系统,通过利用视频内容的关联性和冗余性在规模上实现实时视频分析,其中包括离线相位建立跨相机关系的决策,以及高效在线相位的实时视频推理,同时比基线方法具有更高的查询准确性和较高的性能收益。
May, 2021
在这篇论文中,我们提出了一种新颖的 RoI 特征提取器 Semantic RoI Align(SRA),它能够在各种变换下提取不变的 RoI 特征,用于两阶段检测器。我们通过引入语义注意力模块,利用 RoI 内的全局和局部语义关系自适应地确定不同采样区域。我们还提出了动态特征采样器 Dynamic Feature Sampler,根据 RoI 的宽高比动态采样特征,以提高 SRA 的效率。另外,我们引入了一种新的位置嵌入 Area Embedding,通过改进采样区域表示提供更准确的位置信息给 SRA。实验证明,我们的模型在比基准模型轻微计算开销的情况下显著优于其他模型,并具有出色的泛化能力,可以改善各种最先进的主干网络和检测方法的性能。
Dec, 2023
本文提出了一种自适应挖掘周边上下文信息的 RoI 运算符,并将其无缝集成到 R-CNN 中,形成了一种端到端训练的物体检测系统,称为自上下文 R-CNN。在 Pascal VOC、Microsoft COCO 和 KITTI 数据集上进行了实验,结果证明该方法在鲁棒性、鲁棒性和对抗攻击方面均表现良好。
Jul, 2018
本研究提出了一种名为 CoupleNet 的新型全卷积网络,通过耦合全局结构与局部部分进行目标检测,其中一个分支采用位置敏感 RoI 池化来捕获对象的局部信息,而另一个分支则采用 RoI 池化来对全局和上下文信息进行编码。实验证明该方法具有良好的效果。
Aug, 2017
在视频物体检测中,使用提取视频中当前帧之前的帧中的信息对当前帧进行检测以提取时序信息是一种自然的选择,本文提出了一种基于特征相似性的新型 Temporal RoI Align 算子,用于从当前视频中的其它帧特征图中提取与当前帧相似的结果,能够提取整个视频的时序信息,并将其整合到单帧视频检测器和其他现有视频检测器中,经定量实验表明,所提出的 Temporal RoI Align 算子可以显著提高检测性能。
Sep, 2021
通过人类视觉传递的信息流作为灵感,提出了一种基于 CNN 的特定目标检索方法,将注意力放在感兴趣的区域上可以显著提高检索的准确性,并且使用新颖的显着性度量对区域进行加权,进一步提高了检索的准确性。
Mar, 2017
本文提出了一种利用 Swin transformer 作为自编码器网络的主要构建模块,将二进制 ROI 掩模集成到不同层的网络中,以提供空间信息指导。实验结果表明,这种模型在 ROI PSNR 方面优于其他方法,在 COOCO 验证集上具有更好的目标检测和实例分割性能。
May, 2023
本文提出了一种非局部递归网络(NLRN),将非局部操作纳入递归神经网络(RNN)用于图像恢复,在图像去噪和超分辨率任务中,该模型由于递归非局部操作和相关性传播而取得了优越的结果。
Jun, 2018