用于大型图像语义分割的高效梯度式DenseNets
本文提出了一种基于Densely Connected Convolutional Networks的语义分割方法,不需要进一步的后处理模块或预训练即可在CamVid和Gatech等城市场景基准数据集上达到最先进的结果。此外,由于模型的智能构造,我们的方法在参数数量方面比当前已发布的最佳结果少得多。
Nov, 2016
该技术报告介绍了一种减少DenseNet在训练期间内存消耗的策略,使得可以在单个GPU上训练非常深的网络,并在ImageNet ILSVRC分类数据集上获得了最先进的单剪裁top-1误差为20.26%。
Jul, 2017
本研究对语义分割进行了实验,利用具备ladder-style卷积架构的修改版DenseNet-169模型,针对四个基准数据集进行了预测,并在ROB 2018的指导下进行了验证。实验结果表明了几个有趣的发现。
Jun, 2018
在本文中,我们探索了以场景解析、人物部分分割和语义图像分割为任务的密集图像预测的元学习技术的构建,我们构造了一个有用的搜索空间并演示了即使是通过有效的随机搜索,我们也能够找到优于人工设计的架构以及在城市街景解析、人物部分分割和语义图像分割等三个密集预测任务上实现的最先进水平,同时减少一半的参数和计算成本。
Sep, 2018
本文提出了稠密视觉Transformer(dense vision transformers)作为密集预测任务的主干网络,相对于全卷积网络,该结构以恒定和较高的分辨率处理表示,并在每个阶段具有全局感受野。在单眼深度估计和语义分割任务上,我们的实验表明,该结构在有大量训练数据的情况下能够显着提高性能,是一种大有前途的新型神经网络结构。
Mar, 2021
本研究设计了一种双并行、使用不同扩张率的卷积层的 ResNeXt,以提高区域感知率和保留局部细节,进而实现语义分割,并在实时 Cityscapes 和 CamVid 数据集上取得迄今最优成果。
Nov, 2021
本文提出了一种使用多尺度特征融合网络和BiFPN来进行实时图像语义分割的方法ESeg,通过扩展传统的多尺度特征空间来实现,不需要高分辨率和昂贵的空洞卷积。实验证明,ESeg在多个数据集上的表现比先前的方法更准确,并且实时性能得到提升。
Mar, 2022
通过使用类ResNet的主干和小型多尺度头部的简单编码器-解码器架构,扩大有效接受域, 实现了与HRNet等复杂语义分割架构相当甚至更好的性能,提供了简单有效的基准模型供从业者开发高效的语义分割模型。
Jun, 2022
在这篇论文中,我们研究了密集连接卷积网络(DenseNets)的效果,并发现其在流行的ResNet风格架构中被低估。我们通过串联密集连接的方式展示了DenseNets的优势,并且进行了架构调整、块重设计和改进训练方法以提高DenseNets的性能和内存效率。我们的模型不仅超越了Swin Transformer、ConvNeXt和DeiT-III等关键架构,还在ImageNet-1K等领域展现了接近最新模型的性能,包括ADE20k语义分割和COCO目标检测/实例分割任务。最后,我们提供了以经验为基础的分析结果,揭示了串联连接胜过加法连接的优点,从而引导人们重新偏好DenseNet风格的设计。
Mar, 2024