PixelNet:通向通用像素级架构
本文提出了从像素边缘检测到表面法线估计到高级语义分割的像素级预测问题的设计原则,通过分层抽样像素来增加多样性,探索复杂的非线性预测器并通过单一的体系结构高效地训练各种像素标记任务,最终在 PASCAL-Context 数据集上的高级语义分割、NYUDv2 深度数据集上的表面法线估计和 BSDS 上的边缘检测任务中达到了最先进的结果。
Feb, 2017
本文提出了一种基于卷积神经网络的 Fully Convolutional Networks(FCN)方法,可以用于图像的深度语义分割。通过该方法,我们成功地提高了 PASCAL VOC、NYUDv2、SIFT Flow 和 PASCAL-Context 等公开数据集上的 segmentation 模型的性能,并且推断速度远快于之前的相关工作。
May, 2016
该研究证明,卷积网络可以通过端到端的训练,从像素到像素地训练,超越先前的语义分割最先进方法,通过自适应大小输入和高效学习来生成相应大小的输出。该研究还详细介绍了全卷积网络的应用于空间密集预测任务,并将 AlexNet、VGG 网和 GoogLeNet 等现代分类网络改进成全卷积网络,并将它们学习到的表示通过微调应用于语义分割任务。最后,该研究提出了一种新的网络架构,将深层次粗糙层和浅层外观信息相结合以生成准确和详细的分割结果,在 PASCAL VOC、NYUDv2 和 SIFT Flow 数据集上实现了最先进的语义分割(2012 年的 mean IU 相较前一方法提高 20%),对典型图像的推理时间仅需三分之一秒。
Nov, 2014
本文进行了实例感知语义分割的研究,提出了一种利用全卷积网络的方法预测语义标签、深度和基于实例的编码,并通过低层次计算机视觉技术在 KITTI 和 Cityscapes 街景数据集上生成最先进的实例分割,该方法在性能上超过了现有的工作,并可以额外预测单个实例与单眼图像的绝对距离以及像素级语义标签。
Apr, 2016
本文提出了一种使用简单的全卷积网络预测超像素的新方法,以及在此基础上进行稠密预测任务下采样 / 上采样方案的改进,实验结果表明该方法能够在 50fps 的速度下取得最先进的超像素分割性能,并且在公共数据集上能够获得更好的视差估计精度。
Mar, 2020
本文介绍的第一种领域自适应语义分割方法,提出了一种针对像素预测问题的无监督对抗方法,该方法包括全局和类别特定的适应技术,它使用具有全卷积领域对抗学习的新型语义分割网络进行全局领域对齐,然后通过弱学习的推广进行类别特定适应,这使得从源域传递到目标域的空间布局的显式转移成为可能,本方法在多个大规模数据集上优于基线方法,包括适应各种真实城市环境、不同合成子域,从模拟到真实环境,并且在一个新的大规模仪表盘相机数据集上也具有很好的表现。
Dec, 2016
本文通过可视化优化地形图,比较了三个基于 FCN 的模型在多个数据集上的性能,并探索了 FCN 中跳过层连接与模型广义能力之间的关系,以及不同批量大小下的损失表面与模型广义能力的关系。
Jan, 2019
通过基于超像素采样的方法和使用统计过程控制的梯度来训练和测试,该论文提出了一种在 Pascal Context,SUN-RGBD 数据集上性能优于或等于传统方法的语义分割网络,减少了上采样运算的复杂度。
Jun, 2017
本文提出了一种基于像素级别处理的高性能全卷积神经网络,用于历史文献图像分割,并引入了一种独立于模糊真实度量的前景像素准确度评价指标,该指标仅计算二值化页面中的前景像素,从而使研究人员可以比较不同的分割方法在文本或图像分割方面的成功能力。
Nov, 2017