SGDM: 静态引导动态模块增强视觉模型

Mar, 2024

SGDM: 静态引导动态模块增强视觉模型

SGDM: Static-Guided Dynamic Module Make Stronger Visual Models

Wenjie Xing, Zhenchao Cui, Jing Qi

TL;DR通过 Razor 动态卷积和静态引导动态模块提高目标检测性能，并成功应用于多个不同的目标检测框架中，取得了显著的性能提升。

Abstract

The spatial attention mechanism has been widely used to improve object detection performance. However, its operation is currently limited to static convolutions lacking content-adaptive features. This paper innovatively approaches from the perspective of →

spatial attention mechanism dynamic convolution razor dynamic convolution static-guided dynamic module object detection

发现论文，激发创造

面向语义分割的类别动态图卷积

该论文提出基于类别的动态图卷积网络 CDGCNet，采用类别动态图卷积（CDGC）模块自适应地传递信息，获得了在 Cityscapes，PASCAL VOC 2012 和 COCO Stuff 等三个流行的语义分割基准上的 state-of-the-art 表现。

Jul, 2020

全维动态卷积

该论文提出一种更加通用而优雅的动态卷积设计，Omni-dimensional Dynamic Convolution (ODConv)，通过多维度的注意力机制与并行策略学习卷积核在四个维度上的补充注意力，以提高各种流行的 CNN 主干网络的准确性，且可通过将其插入到现有 CNN 架构中来使用，实验证明与多个动态卷积方法相比，ODConv 甚至只需一组卷积核就能显著提高准确率。

Sep, 2022

SD-Conv：动态卷积的参数效率

本文提出了一种新框架 Sparse Dynamic Convolution（SD-Conv），它将动态卷积和不规则剪枝结合起来，通过使用可学习阈值导出二值化掩码以减少参数和计算成本，在 Imagenet-1K 数据集上获得更高的性能，并在多个下游任务中展示出优于基线的表现，从而成为常规动态卷积的高效替代品。

Apr, 2022

基于空间信息引导的卷积神经网络实现实时 RGBD 语义分割

提出 Spatial information guided Convolution（简称 S-Conv）算法，将 RGB 特征与 3D 空间信息高效地集成，不会严重影响实时应用，可用于语义分割任务，实现出色的性能，并在 NYUDv2 和 SUNRGBD 数据集上获得最先进的性能。

Apr, 2020

动态区域感知卷积

提出了一种名为 DRConv 的动态区域感知卷积，它可以自动将多个过滤器分配给具有相似表示的相应空间区域，以更有效处理复杂和不同的空间信息分布，从而代替任何现有网络中的标准卷积，尤其适用于高效网络中的动力卷积层。在 ImageNet 分类中，DRConv-based ShuffleNetV2-0.5x 在 46M 乘积添加水平下实现了 67.1% 的最新性能，相对改进了 6.3%。

Mar, 2020

动态卷积：利用空间稀疏性加速推理

本文提出了一种基于条件输入图像的动态卷积方法，其中通过引入一个小型门控分支来学习空间位置，以决定应该对哪些区域进行评估，通过在 CIFAR、ImageNet 和 MPII 数据集上的实验证明该方法在处理人体姿态估计等空间稀疏任务方面，相对已有方法具有更好的准确性和处理效率。

Dec, 2019

动态卷积：卷积核的注意力机制

提出一种名为 Dynamic Convolution 的新设计，基于卷积核的注意力动态地聚合多个并行卷积核，从而增加模型复杂度，提高卷积神经网络的表示能力，有效提高 MobileNetV3-Small 模型在 ImageNet 分类任务上的精度。

Dec, 2019

A-SDM: 通过冗余消除和性能优化加速稳定扩散

通过模型架构调整、冗余剪枝、全局 - 局部交互注意机制和语义感知监督等方法，本研究提出了一种有效训练轻量级模型、并在有限资源下提高模型速度的方法。

Dec, 2023

动态 Mobile-Former：在核空间中利用注意力和残差连接加强动态卷积

Dynamic Mobile-Former 是一种集成了轻量级注意力机制和增强动态卷积优势的网络模型，通过 Transformer 和 MobileNet 的双向集成实现对全局和局部特征的处理，在图像分类、目标检测和实例分割等各个视觉任务上取得了高效且卓越的性能。

Apr, 2023

动态组卷积用于加速卷积神经网络

本文提出一种动态组卷积 (Dynamic Group Convolution, DGC) 方法，它不仅保留了原有网络结构，还能够根据输入图像动态选择连接哪些输入通道，以实现对图像语义特征的自适应提取，有效提高了卷积神经网络的计算效率和图像分类性能。

Jul, 2020