基于高层引导的语义部分分割深度学习
该研究论文结合深度卷积神经网络和概率图模型的方法来解决像素级分类(语义图像分割)任务中深层网络往往无法精确定位目标分割的问题,并通过将深层网络的响应与全连接条件随机场相结合,提出了一种 DeepLab 系统。定量实验表明,该方法在 PASCAL VOC-2012 语义图像分割任务中,IOU 精度可达 71.6%。
Dec, 2014
本文提出了一种改进图像语义分割性能的方法,通过使用上下文信息学习Patch-Patch和Patch-Background的语义相关性,使用带有条件随机场的CNN对邻近patch之间的语义相关性进行建模,并采用高效的分段训练方法。同时,通过使用传统的多尺度图片输入和滑动金字塔池化等手段捕捉图像区域与背景的上下文信息,结果在多种流行的语义分割数据集上取得了最先进的性能,并在PASCAL VOC 2012数据集上取得了78.0的交叉联合分数。
Apr, 2015
本文提出了一种同时处理语义对象和部件分割的联合解决方案,其中提供了更高级的对象级上下文来引导部件分割,并利用更详细的部件级定位来改进对象分割。所提出的方法在三个不同的数据集上进行了广泛的评估,证明它可以相互增强对象和部件分割的性能,并在两个任务上都优于现有技术水平。
May, 2015
我们提出了一种基于CNN和CRF参数的联合随机优化的新的CNN-CRF端到端学习框架,经实验表明这种方法在深度图像身体部件的语义标记上比竞争技术表现更好。
Nov, 2015
本文提出了一种利用Deep Learning完成语义图像分割的方法,通过引入atrous convolution以及atrous spatial pyramid pooling来解决对象掩模问题,并结合max-pooling和downsampling与全连接条件随机场(CRF)来提高对象边界的定位准确性,在PASCAL VOC-2012等数据集上全面超越了以往的成果。
Jun, 2016
本文提出了一种基于深度学习的DeepVoting算法,该算法可以检测物体的语义部位,即使存在局部遮挡的情况,并可以同时进行端到端的优化,通过提取局部视觉线索和空间关系进行投票机制,实现了该任务。
Sep, 2017
本文提出了一种用于弱监督下的图像标注的全新框架——AffinityNet。该框架通过训练一个深度神经网络,使其能够预测一对相邻图像坐标之间的语义亲和性,从而通过随机游走来实现语义的传播,以生成图像的分割标签。实验表明,使用我们的方法生成的分割标签训练的DNN,甚至比其它依赖于更强监管的模型表现更为优秀。
Mar, 2018
本文利用深度学习网络结构,使用单个深度图像为输入,实现了语义分割中对可见和遮挡物体及其部分的类型预测,将语义类别进一步细分为背景和多个前景物体组,并改进了标准的交叉熵损失函数以适应这种情况,实验证明所提出的分类方法能够验证预测出被遮挡物体部分的语义类别,无需增加网络结构规模,其性能在由SUNCG数据集生成的新数据集上得到验证。
Jun, 2019
本文介绍了以往自我监督的学习方式大多聚焦于图像级的表示学习,不能为无监督图像分割等需要空间多样的表示的任务带来改进,通过自我监督学习物体部件提出了新的解决途径,并结合目前趋势的Vision Transformer,利用稠密聚类任务进行空间标记的微调,取得了在语义分割基准测试上超过17%-3%的最先进结果,且在完全无监督分割方面也具有重大潜力。
Apr, 2022