学习语义分割的动态路由
本研究对语义分割进行了实验,利用具备ladder-style卷积架构的修改版DenseNet-169模型,针对四个基准数据集进行了预测,并在ROB 2018的指导下进行了验证。实验结果表明了几个有趣的发现。
Jun, 2018
本文提出了一种在语义分割任务中具有高计算效率的方法,基于完全卷积神经网络,在同时实现高平均交并比的情况下,可以在移动设备上实时运行。
Feb, 2019
本文旨在开发一种通用方法,以前沿的语义视频分割技术结构为基础,通过使用神经体系结构搜索解决方案,设计连接每帧网络输出的上下文块。利用通用的方法,该方法能在市区景观和CamVid数据集等常见基准测试中实现稳定和准确的结果,并且仅需要2 GPU天即可完成。
Apr, 2019
提出了一种名为Graph-guided Architecture Search(GAS)的管道,其中图卷积网络(GCN)作为细胞之间的通信机制,消除了细胞之间的共享约束以实现细胞水平的多样性,并通过搜寻latency-oriented约束来实现速度和性能的平衡,在Cityscapes和CamVid数据集上实现了精度和速度的新的最优平衡。
Sep, 2019
该论文提出基于类别的动态图卷积网络CDGCNet,采用类别动态图卷积(CDGC)模块自适应地传递信息,获得了在Cityscapes,PASCAL VOC 2012和COCO Stuff等三个流行的语义分割基准上的state-of-the-art表现。
Jul, 2020
通过使用类ResNet的主干和小型多尺度头部的简单编码器-解码器架构,扩大有效接受域, 实现了与HRNet等复杂语义分割架构相当甚至更好的性能,提供了简单有效的基准模型供从业者开发高效的语义分割模型。
Jun, 2022
该论文提出了一种名为“Diversified Dynamic Routing”的新型神经网络模型,通过无监督学习的方式解决了Mixture of Experts模型中存在的两个问题,用于在Cityscapes和MS-COCO上进行深度学习的语义分割和实例分割任务,相对于其他基准模型的表现有所提高。
Sep, 2022
通过引入动态令牌过渡视觉转换器(DoViT)对图像进行语义分割,适应性地降低了不同复杂度图像的推理成本,通过逐渐停止部分易处理的令牌的自注意计算并保持难处理的令牌继续前进直到满足停止标准,利用轻量级辅助头部做出令牌传递决策并将令牌划分为保留/停止部分,通过令牌的分离计算,使用稀疏令牌加速自注意层,并在硬件上保持友好性,构建令牌重建模块以收集和重置分组令牌到序列中的原始位置,这对于预测正确的语义掩码是必要的,我们在两个常见的语义分割任务上进行了大量实验证明我们的方法在各种分割转换中大大减少了40%〜60%的FLOPs,mIoU的降低在0.8%以内,并且Cityscapes上的ViT-L/B的吞吐量和推理速度增加了2倍以上。
Aug, 2023
提出了一种数据相关的令牌路由策略用于图像令牌的动态视觉转换器 (DiT),以适应对象尺度和视觉识别的变化,并通过选择多路径特征传播来精心调整图像表达的对象尺度和视觉识别的影响,从而实现更好的性能和良好的复杂度/准确度平衡。
Aug, 2023
本文探索一种新颖的动态网络以应对视觉和语言任务,其中推理结构针对不同输入动态定制。通过引入基本单元并在空间和通道运算领域分组,以构建丰富的路径空间和提升路径选择效率,我们设计了一个空间-通道联合路由器来根据输入样本的空间和通道信息进行路径定制,并在MS-COCO数据集上进行实验证明了提出的动态变压器网络的有效性,获得了Karpathy分割和在线测试服务器上的最新最佳性能。
Jun, 2024