学习语义分割的动态路由

Mar, 2020

Learning Dynamic Routing for Semantic Segmentation

Yanwei Li, Lin Song, Yukang Chen, Zeming Li, Xiangyu Zhang...

TL;DR论文提出一种名为动态路由的方法，使用不同的可微分路由来处理输入中的比例差异，减少语义表示中的比例差异，并支持多路径传播和跳跃连接以提高网络能力。

Abstract

Recently, numerous handcrafted and searched networks have been applied for semantic segmentation. However, previous works intend to handle inputs with various scales in pre-defined static architectures, such as FCN, U-Net, and DeepLab series. This paper studies a conceptually new metho

发现论文，激发创造

基于Ladder-DenseNet模型的鲁棒语义分割

本研究对语义分割进行了实验，利用具备ladder-style卷积架构的修改版DenseNet-169模型，针对四个基准数据集进行了预测，并在ROB 2018的指导下进行了验证。实验结果表明了几个有趣的发现。

Jun, 2018

一种高效的语义分割解决方案：采用带孔可分离卷积的ShuffleNet V2

本文提出了一种在语义分割任务中具有高计算效率的方法，基于完全卷积神经网络，在同时实现高平均交并比的情况下，可以在移动设备上实时运行。

Feb, 2019

用于语义视频分割的动态单元体结构搜索

本文旨在开发一种通用方法，以前沿的语义视频分割技术结构为基础，通过使用神经体系结构搜索解决方案，设计连接每帧网络输出的上下文块。利用通用的方法，该方法能在市区景观和CamVid数据集等常见基准测试中实现稳定和准确的结果，并且仅需要2 GPU天即可完成。

Apr, 2019

面向实时语义分割的图像引导架构搜索

提出了一种名为Graph-guided Architecture Search（GAS）的管道，其中图卷积网络（GCN）作为细胞之间的通信机制，消除了细胞之间的共享约束以实现细胞水平的多样性，并通过搜寻latency-oriented约束来实现速度和性能的平衡，在Cityscapes和CamVid数据集上实现了精度和速度的新的最优平衡。

Sep, 2019

面向语义分割的类别动态图卷积

该论文提出基于类别的动态图卷积网络CDGCNet，采用类别动态图卷积（CDGC）模块自适应地传递信息，获得了在Cityscapes，PASCAL VOC 2012和COCO Stuff等三个流行的语义分割基准上的state-of-the-art表现。

Jul, 2020

语义分割的简单高效结构

通过使用类ResNet的主干和小型多尺度头部的简单编码器-解码器架构，扩大有效接受域，实现了与HRNet等复杂语义分割架构相当甚至更好的性能,提供了简单有效的基准模型供从业者开发高效的语义分割模型。

Jun, 2022

多样化动态路由用于视觉任务

该论文提出了一种名为“Diversified Dynamic Routing”的新型神经网络模型，通过无监督学习的方式解决了Mixture of Experts模型中存在的两个问题，用于在Cityscapes和MS-COCO上进行深度学习的语义分割和实例分割任务，相对于其他基准模型的表现有所提高。

Sep, 2022

动态令牌传递变换器用于语义分割

通过引入动态令牌过渡视觉转换器（DoViT）对图像进行语义分割，适应性地降低了不同复杂度图像的推理成本，通过逐渐停止部分易处理的令牌的自注意计算并保持难处理的令牌继续前进直到满足停止标准，利用轻量级辅助头部做出令牌传递决策并将令牌划分为保留/停止部分，通过令牌的分离计算，使用稀疏令牌加速自注意层，并在硬件上保持友好性，构建令牌重建模块以收集和重置分组令牌到序列中的原始位置，这对于预测正确的语义掩码是必要的，我们在两个常见的语义分割任务上进行了大量实验证明我们的方法在各种分割转换中大大减少了40％〜60％的FLOPs，mIoU的降低在0.8％以内，并且Cityscapes上的ViT-L/B的吞吐量和推理速度增加了2倍以上。

Aug, 2023

DiT: 高效的视觉变压器与动态令牌路由

提出了一种数据相关的令牌路由策略用于图像令牌的动态视觉转换器 (DiT)，以适应对象尺度和视觉识别的变化，并通过选择多路径特征传播来精心调整图像表达的对象尺度和视觉识别的影响，从而实现更好的性能和良好的复杂度/准确度平衡。

Aug, 2023

通过动态路径定制实现图像字幕

本文探索一种新颖的动态网络以应对视觉和语言任务，其中推理结构针对不同输入动态定制。通过引入基本单元并在空间和通道运算领域分组，以构建丰富的路径空间和提升路径选择效率，我们设计了一个空间-通道联合路由器来根据输入样本的空间和通道信息进行路径定制，并在MS-COCO数据集上进行实验证明了提出的动态变压器网络的有效性，获得了Karpathy分割和在线测试服务器上的最新最佳性能。

Jun, 2024