弱监督语义分割:渐进式补丁学习
本文提出了一种基于弱监督的学习方法,通过将图像视为一个包中的实例将其融入到深度神经网络中,将弱监督的多实例学习约束与深度神经网络集成在一起,并采用端到端的方式优化网络以实现对象分类和发现任务。在 PASCAL VOC 数据集上的测试表明,该方法在对象分类方面可以获得最先进的性能,并且在对象发现方面也具有很强的竞争力,并且测试速度比竞争者更快。
May, 2017
该论文提出了一种新的语义分割框架,采用弱增量学习,使用辅助分类器和软标签更新模型,从图像级别标签中学习新类别的分割,可有效减少由像素逐像素标注带来的时间和经济成本。
Dec, 2021
本研究提出了一种基于图卷积网络的特征传播框架,将完整的伪标签的生成作为半监督学习任务来解决弱监督图像语义分割问题,并在 PASCAL VOC 2012 数据集上通过实验得到了比其他最先进的基线方法更好的结果。
Mar, 2021
提出了一种名为 top-K 汇聚的 Vision Transformer 弱监督语义分割方法(TKP-PCL),通过使用 top-K 汇聚层来增强之前最大汇聚选择的限制,并提出了一种补丁对比误差(PCE)来增强补丁嵌入,从而进一步提高最终结果。实验结果表明,该方法在 PASCAL VOC 2012 数据集上非常高效,并且优于其他最新的弱监督语义分割方法。
Oct, 2023
本文介绍了一种新的无监督和半监督领域适应方法,利用对比学习通过对跨域中的结构相似标签块的特征进行对齐来弥合域差距,以便更容易训练和提高性能。此方法在两个具有挑战性的领域适应分割任务中始终优于现有的无监督和半监督方法,特别是当目标域注释数量很小时。
Apr, 2021
本研究探索了将图像级别与局部级别的判别相结合的自我监督表示学习方法,通过同时观察局部和全局视觉特征来增强学习表示的质量。我们提出了一个简单而有效的补丁匹配算法,借助视觉变换器(ViT)作为骨干网络,从而生成图像级别和补丁级别的表示。结果显示,我们的方法在图像分类和下游任务中表现优于最先进的图像级别表示学习方法。
Oct, 2023
本研究旨在解决深度学习架构在面临新增任务时由于灾难性遗忘导致性能下降的问题,提出了一种知识蒸馏方法来保留以前学习过的类别信息,并同时学习新类别,本文在 Pascal VOC2012 数据集上进行了实验验证其有效性。
Jul, 2019
本文提出了一种新颖的细粒度视觉分类框架,其中包括渐进式训练策略和随机拼图补丁生成器,以有效地融合不同粒度的特征,并在多个标准的细粒度视觉分类数据集上取得了最先进的性能表现。
Mar, 2020
本文提出了一种基于 PatchNet 模型与 VSAD 特征表达方法的图像场景识别混合表示方案,并在 MIT Indoor67 与 SUN397 两个基准数据集上取得了最新的最优性能结果。
Sep, 2016
本文介绍了一种使用图像标签进行弱监督语义分割的模型,利用图像标注作为注意机制来识别图像中的语义区域,并描述了如何将此掩模生成策略纳入完全端到端可训练的过程中,其中网络同时学习对图像进行分类和分割,实验表明,利用生成的类特定掩模可以超越只使用图像标记的最新弱监督语义分割方法甚至某些利用额外监督或训练数据的模型。
Apr, 2018