CAR: 语义分割的类别感知正则化
FastCAR 是一种新颖的多任务学习方法,用于分类和回归任务,在任务异质性和微妙相关性下处理对象分类和连续属性变量回归,通过标签转换方法和单任务回归网络架构,在两个任务的联合学习中超越传统的 MTL 模型,达到 99.54% 的分类精度和 2.3% 的回归平均绝对百分比误差,并在 4536 张 224x224 像素的图像上使用 Advanced Steel Property 数据集进行实验证明 FastCAR 实现了降低延迟和提高时间效率。
Mar, 2024
该研究提出了一种使用全卷积孪生网络以像素级方式解决视觉跟踪问题的方法,其中包括特征提取和边界框预测两个子网络,不需要基于区域建议,能够更简单、更准确地进行目标跟踪。
Nov, 2019
本研究提出了一种基于多项式分类问题的上色方法,并应用加权函数于类别,通过将颜色值转换为颜色类别及其逆转换的一系列公式,优化了颜色类别转换的不同 bin 尺寸。在实际应用中,通过观察类别外观、标准差和模型参数,基于大规模实时图像,我们为分类任务提出了 532 种颜色类别。同时,在训练过程中,我们提出了一种基于每批次真实类别外观的类别加权函数,以确保正确饱和个别对象。我们调整了较频繁观察到的主要类别的权重,通过降低它们的权重,同时提高较少常见的次要类别的权重。我们的类别重新权重函数中提出了一个超参数,用于找到主要和次要出现类别之间的最佳折衷。为了增强次要类别的稳定性,我们应用正则化方法,但在对象的边缘可能会出现偶发的次要噪点。因此,我们提出了一种由 Segment Anything Model(SAM)强化的新颖的对象选择性颜色均衡方法,以改进和增强这些边缘。此外,我们还提出了两个新的颜色图像评估指标:色彩类别激活比率(CCAR)和真实激活比率(TAR),以量化颜色分量的丰富性。我们通过在六个不同数据集上进行定性和定量比较,包括 Place,ADE,Celeba,COCO,Oxford 102 Flower 和 ImageNet,将我们提出的模型与现有模型进行了比较。实验结果表明,我们的模型在可视化、CNR 以及我们提出的 CCAR 和 TAR 测量指标方面优于其他模型,同时在回归(MSE,PSNR)、相似度(SSIM,LPIPS,UIUI)和生成性能(FID)方面表现仍是令人满意的。
Mar, 2024
本文提出了一种新的方法来校准分割网络,考虑了不同类别和目标区域所带来的困难。具体来说,我们提出了一种将类别和区域约束融入学习目标的公式,利用多个惩罚权重来解决类别和区域差异的问题。然而,手动找到最佳的惩罚权重可能是不可行的,会阻碍优化过程。为了克服这个限制,我们提出了一种基于类别和区域自适应约束(CRaC)的方法,可以在训练过程中学习类别和区域的惩罚权重。CRaC 基于广义增广拉格朗日方法,这是一种在约束优化中广泛应用的技术。在两个流行的分割基准和两个知名的分割网络上进行的实验证明了 CRaC 相比现有方法的优势。代码可以在此链接中找到:https:// 这个网址。
Mar, 2024
本研究基于半监督度量学习方法,提出了四种对应关系来捕捉低 - level 图像相似性、语义标注、共现和特征亲和力。这些节点可以从任何部分注释的训练图像中以数据驱动的方式进行学习,因此,该模型不仅适用于弱监督分割中标记的像素,还适用于未标记的像素。
May, 2021
本文提出了基于显著性引导的跨类和内部类约束模型 (I$^2$CRC),以辅助 CAMs 中的激活对象区域的扩张,在 PASCAL VOC 2012 和 COCO 数据集上进行的广泛实验表明,I$^2$CRC 在众多最先进的方法中具有显著的优势。
Jun, 2022
基于语义锚点的正则化方法(SAR)可以通过使用预定义的类锚点来引导特征学习,从而提高紧凑度和类间可分性,避免引入偏差和错误。该方法在现有模型中可以以即插即用方式使用,并在大规模实验中优于之前的方法。
Dec, 2023
本文提出了基于区域级别对比和一致性学习框架 (RC^2L) 的半监督语义分割方法,通过引入区域级别损失,包括 Region Mask Contrastive (RMC) 损失、Region Feature Contrastive (RFC) 损失、Region Class Consistency (RCC) 损失和 Semantic Mask Consistency (SMC) 损失,实现了更好的稳定性和性能。在 PASCAL VOC 2012 和 Cityscapes 数据集上的实验结果表明,所提出的方法优于现有最先进方法。
Apr, 2022