深度目标共分割
使用基于注意力机制的深度神经网络提出了面向对象共分割的注意力机制,同时使用注意力学习者算法实现了线性时间复杂度的多输入图像分割,实验结果表明,该模型在多个数据集上取得了最先进的性能,并大幅降低了计算时间。
Oct, 2018
本文提出了一个空间和语义调制的深度网络框架,用于共同分割多个相关图像中的共享对象。该模型通过使用骨干网络提取多分辨率的图像特征,并通过非监督学习捕获图像特征描述符之间的相关性。使用监督图像分类任务来模拟语义调制器,并使用层次二次池化模块转换图像特征,以集中于共同对象区域的分割。结果表明,该模型在四个图像共分割基准数据集上的表现优于现有的最先进方法。
Nov, 2019
我们提出了一种联合匹配和分割图像集合中同一类别的对象实例的方法,这种方法利用了两个任务的互补性,通过从语义匹配得到的估计密集对应场来提供对象共分割的监督,并且从对象共分割得到的预测对象掩码来改善语义匹配的性能,我们的算法在五个基准数据集上表现优异。
Jun, 2019
本研究旨在推进目标识别的最新进展,提出了一种数据集的形式,通过将目标识别的问题置于场景理解的更广泛背景下,聚集了包含常见物品的复杂日常场景的图像,并利用每个实例分割对物品进行标记以协助精确定位,该数据集包含 91 种 4 岁儿童容易识别的对象类型,有 328k 张图像和 250 万个标记实例。本文最终提供了一种基于可变形零件模型的边界框和分割检测结果的基线性能分析。
May, 2014
该论文提出了一个名为 UFO 的统一框架,通过引入自注意机制和内部 MLP 学习模块,结合图像的空间信息和特征相似性,实现了针对协同分割、协同显著性检测和视频显著性对象检测的多任务单一网络架构,实验结果表明,该方法在精度和速度方面均优于现有方法。
Mar, 2022
本文提出了一种名为 DOC 的深度网络架构,它能在单个图像上检测物体边界并估计边界所有权,可用于恢复遮挡关系,并通过大规模实例遮挡边界数据集 PIOD 进行了验证。
Nov, 2015
本文研究了在一组图像中共同语义对象的共同分割,并使用对比式语言 - 图像预训练框架 (CLIP) 来完成该任务。通过一个用于独立处理图像集中每个图像的骨干分割网络,我们引入了 CLIP 中的语义信息,并通过三个关键模块 ——i) 图像集特征对应模块,对图像集的全局一致语义信息进行编码;ii) CLIP 交互模块,利用 CLIP 提取的图像集的共同语义信息来优化骨干特征;iii) CLIP 正则化模块,引导 CLIP 朝向共同分割任务,找到最佳的 CLIP 语义并用其来正则化骨干特征 —— 以一种粗糙到精细的方式优化这些特征。在四个标准的共同分割基准数据集上的实验证明了我们方法的性能优于最先进的方法。
Aug, 2023
通过引入语义物体性概念分析成像过程,本文提出了一种基于物体性假设的语义物体分割和深度估计网络(SOSD-Net),并采用期望最大化算法的迭代思想更有效地训练该网络,实验结果表明该方法具有卓越的性能。
Jan, 2021
本文利用深度学习网络结构,使用单个深度图像为输入,实现了语义分割中对可见和遮挡物体及其部分的类型预测,将语义类别进一步细分为背景和多个前景物体组,并改进了标准的交叉熵损失函数以适应这种情况,实验证明所提出的分类方法能够验证预测出被遮挡物体部分的语义类别,无需增加网络结构规模,其性能在由 SUNCG 数据集生成的新数据集上得到验证。
Jun, 2019
本文介绍一种基于深度分割模型集成的半监督学习方法,利用有标注的图片训练模型子集,并使用未标注的图片协同训练模型,同时使用对抗样本来保持多样性,实现语义图像分割的性能提升,在两个医学图像数据集上取得最先进的结果。
Mar, 2019