SPGNet: 场景解析的语义预测引导
该研究提出了一种 Subspace Pyramid Fusion Network (SPFNet) 的编码解码结构,旨在提高像素级分割的性能,并采用多尺度 / 全局上下文信息进行上下文聚合,通过实验结果表明该方法在语义分割方面与其他现有技术相当竞争力。
Apr, 2022
本文提出了一种 Context Encoding Module 方法,在原有 FCN 框架的基础上加入了全局场景语义信息来优化语义分割结果,在 PASCAL-Context、PASCAL VOC 2012 和 ADE20K 数据集上取得了最新最优的成果,并且通过在 CIFAR-10 数据集上进行对比实验表明该方法可以用来改善相对浅层网络的特征表示效果。
Mar, 2018
通过引入语义分割信息,本文提出了一种两步法的图像修复模型,将图像修复过程分为分割预测(SP-Net)和分割导向(SG-Net)两个步骤,实验证明,该方法优于现有方法,提供了多模态图像修复的可能性。
May, 2018
自动驾驶汽车的语义分割是理解周围环境的关键技术。研究通过融合编码器 - 解码器和两通道架构,提出了空间助理编码器 - 解码器网络(SANet),并在设计中利用不同分辨率的特征提取和池化模块以优化特征提取和实现语义提取,最终在实时 CamVid 和 Cityscape 数据集上达到竞争性的结果。
Sep, 2023
我们提出了一种网络架构,用于执行高效的场景理解,包括改进的引导上采样模块,新的基于空间采样的实例分割模块和高效网络设计,并测试其在不同数据集上的性能,该网络是目前发表的场景理解中最高效的架构之一,对于语义分割比最快的竞争对手准确性高 8.6%,对于实例分割几乎快五倍于最高效的网络。
May, 2019
采用引导自我关注机制的卷积神经网络模型对医学图像进行语义分割,能够更好地捕捉图像中的上下文依赖关系,去除冗余的信息提取并集成本地特征和全局依赖,强调相关特征关联,从而取得更好的分割效果。
Jun, 2019
提出了一种有效的轻量级编码器 - 解码器网络以及其他相关模块,用于在移动机器人中进行 RGB-D 语义分割,通过跨模态相关性和补充线索可以准确提取多层次 RGB-D 特征,实验结果表明该方法在分割准确性、推理时间和参数方面具有更好的权衡。
Aug, 2023
本文提出了一个广义的场景图生成模型 —— 视觉语义解析,并基于动态、注意力机制的二分图传递框架设计了关注于图节点和边的视觉语义解析网络 (VSPNet),同时通过一种全新的图对齐算法,建立了第一个基于图的弱监督学习框架。大量实验证明 VSPNet 优于弱监督基准,而且速度是基准的数倍,因此是训练时效和性能平衡的一个不错的选择。
Jan, 2020
通过多级视觉变换编码器中的多级特征,本文提出了一种新颖的语义分割解码方案,旨在降低计算开销、提高分割准确性,并通过聚合后的语义增强多级特征,从注意力分配的角度保持上下文一致性,大幅降低计算成本。实验结果表明该方案在计算成本上优于现有语义分割模型,且没有准确性损失;深入的消融研究证明了所提出思路的有效性。
Feb, 2024
我们提出了一种新颖的轻量级分割架构,名为多尺度特征传播网络 (MFPNet),通过设计具有柔性瓶颈残差模块的鲁棒的编码器 - 解码器结构,探索深入且丰富的多尺度语义上下文,同时利用图卷积网络 (GCNs),在瓶颈残差模块之间进行多尺度特征传播,最终在基准数据集上表现出优异的分割结果。
Sep, 2023