- 超越现有技术的图像分割任务的透明度失真鲁棒性
我们提出了一种方法,用空间变化的失真合成现有数据集,实验证明这种失真效果会降低最先进的分割模型的性能。预训练和扩展模型容量证明是缓解性能降低的有效策略,而仅在失真图像上进行微调只能带来边缘性能改进。
- 符合语义图像分割:事后量化预测不确定性
我们提出了一种后续处理、计算轻量级的方法来量化语义图像分割的预测不确定性。我们的方法使用合拢预测生成统计上有效的预测集,以预定义的置信水平保证包含地面真实分割掩模。我们介绍了一种基于热图的合拢化预测的新型可视化技术,并提供了评估其实证有效性 - 推进医学图像中的低秩和局部低秩矩阵逼近:系统文献综述与未来方向
医学成像中应用低秩矩阵逼近和局部低秩矩阵逼近具有潜力。通过系统文献综述,本文研究了低秩矩阵逼近和局部低秩矩阵逼近在医学成像中的应用,讨论了存在的挑战与局限,并探讨了这些方法在医学成像中的潜力、有效性以及扩展到不同类型医学数据的可能性。同时提 - 语义分割时代的损失函数:调查与展望
本综述系统地评估了用于图像分割的 25 种损失函数,并提出了分类法和评估方法,以帮助研究人员找到适用于其应用的最佳损失函数。对医疗和自然图像数据集进行了中立评估,并指出了当前挑战和未来研究机会。
- 激光雷达标注就是您所需的
通过使用卷积神经网络和激光雷达数据,本研究旨在提高图像分割的效率,特别是在自动驾驶系统中的道路表面分割任务中,通过减少标注工作量并在不降低分割质量的情况下训练图像分割模型。
- 开放式复合领域自适应与对象风格补偿的语义分割
本文通过构建对象级差异度记忆来实现对象样式补偿,以更准确地计算目标域图像的伪标注,从而在不同数据集上取得了最先进的结果。
- BTSeg:领域自适应语义分割的巴洛孪生规范化
通过利用图像级对应作为弱监督信号,我们提出了 BTSeg,它可以学习对不良条件不敏感的分割模型,通过不同不良条件下的图像来增强训练数据,它在 ACDC 和 ACG 基准测试中表现优秀,且相比现有的最先进方法更简单易用。
- 评估语义分割模型的对抗鲁棒性
该研究提出了一种基于梯度的迭代攻击方法来评估在语义图像分割领域中防御对抗扰动的模型的鲁棒性,并发现只有使用对抗样本进行训练才能获得鲁棒性,并分析了鲁棒性和准确性之间的权衡。
- 基于 PyTorch 的开源监督语义分割工具箱 SSSegmenation
这篇论文提出了 SSSegmentation,这是一个基于 PyTorch 的开源有监督语义图像分割工具箱,它基于 MMSegmentation 的设计,但由于更少的依赖因此更容易使用,在相似的训练和测试设置下实现了更优异的分割性能;此外, - MM语义图像分割:二十年的研究
本调查总结了涵盖二十年的 SiS 研究,并提出了文献综述以及使用转换器的深度学习方法的最新趋势,并强调了 DASiS 技术的影响,其中包括多域学习,域泛化和在对新环境进行分割时削减域。项目还介绍了几个与语义图像分割相关的任务和应用,如医学图 - 无人航天器图像的语义图像分割的合成数据
我们提出了一种生成合成图像数据的方法,用于语义分割,为其他任务提供泛化能力,并提供由无人驾驶宇宙飞船的二维单眼图像组成的原型合成图像数据集,以便进一步研究自主空间飞行器汇合问题。我们在这些合成数据上展示了强的基准结果(Sørensen-Di - 基于 CNN 的智能路灯管理系统,利用智能闭路电视摄像机和语义分割
通过使用计算机视觉技术中的智能交通监控系统并结合闭路电视(CCTV)摄像头的方法,自动检测行人或车辆的存在并控制 LED 路灯的亮度,从而使路灯在其不需要亮度的情况下降低其亮度,以避免能源浪费和降低成本。该方法的优点是简单,高效,耐久且比传 - CVPR语义图像分割在线适应之路
提出了一种新的问题表述和相应的评估框架来推进无监督领域自适应语义图像分割的研究;介绍了一种在线学习的协议,旨在解决现有协议对于模型的领域局限性和离线学习性质导致算法难以在不断变化的环境中连续自适应的问题,并伴随着多种基准算法和广泛的行为分析 - ICLR基于自然语言的语义分割
LSeg 是一种用于语言驱动语义图像分割的新模型,使用文本编码器计算输入标签的嵌入,和基于 transformer 的图像编码器计算输入图像的嵌入,实现像 “草” 或 “建筑” 这样描述性的输入标签的密集像素嵌入,该模型利用语义类相应的文本 - ICCVISNet: 集成图像级和语义级上下文进行语义分割
本文提出将图像语义分割中的语境信息分为图片级别和语义级别,分别增强像素表示,在 ADE20K,LIP,COCOStuff 和 Cityscapes 等四个基准测试中实现了最先进的准确性。
- ICCV利用图像以外的语境信息进行语义分割
本文研究语义图像分割中的上下文聚合问题,提出了一种基于特征存储模块和类概率分布学习的像素表示增强方法,利用跨图像的上下文信息进一步提高了性能。
- MetaBox+: 基于区域的新型主动学习方法,利用优先级地图进行语义分割
本文提出一种新颖的区域活性学习方法 MetaBox + 用于语义图像分割,该方法采用元回归模型训练估计未标注图像中每个预测分割的交集联合(IoU),并提出了一种简单但实用的注释成本估计方法,通过对基于熵的方法进行比较和分析,本文获得了新的关 - 视觉识别中的金字塔卷积:重塑卷积神经网络
本文介绍了金字塔卷积(PyConv)技术,该技术具有多尺度滤波能力,适用于视觉识别各种核心任务,而且还可以提高识别性能并缩小网络规模。
- DoubleU-Net: 医学图像分割的深度卷积神经网络
提出了基于编码器解码器的方法 DoubleU-Net,该方法在一些医学图像数据集上的实验证明相比于现有方法可获得更准确的语义分割结果。
- CVPRDCNAS:用于语义图像分割的密集连接神经架构搜索
本研究提出一种名为 Densely Connected NAS (DCNAS) 的神经架构搜索框架,通过连接细胞并使用可学习的权重来引入密集连接的搜索空间,并通过路径和通道级别的抽样策略设计一个融合模块来降低搜索空间的内存消耗。DCNAS