- CVPRASAM:通过对抗调整提升片段任意建模
本研究介绍了 ASAM,一种通过敌对调整增强 SAM 性能的新方法,利用稳定性扩散模型增加 SA-1B 数据集子集的敌对实例,展示更真实且与原始标注一致的分割结果,从而在不需要额外数据或架构修改的情况下,显著提高了各种分割任务的表现,为计算 - ATOMMIC:一种提供医学图像一致性多任务工具箱,促进从获取到磁共振成像分析的人工智能应用
AI 正在改变 MRI 的采集和处理过程,ATOMMIC 是一个开源工具箱,通过实现 DL 网络和多任务学习 (MTL) 来应用 AI 于加速 MRI 重建和分析,结合物理模型与分割网络可以提高 MRI 重建和图像分割的性能。
- SpecstatOR: 基于点斑统计的 iOCT 眼科手术分割网络
通过统计斑点模式的统计分析,本研究提出了一种创新的眼科手术术中光学相干断层扫描图像分割方法,用于利用统计病理学特定先验知识。研究结果表明,视网膜内和视网膜层之间以及手术器械之间存在统计上不同的斑点模式,从而实现了无需手动标注的先前未见数据的 - CVPRMFP:充分利用概率图进行交互式图像分割
该研究提出了一种名为 MFP 的交互式图像分割算法,通过增强先前的概率图的表达以及将其作为额外的网络输入,该算法充分利用了概率图,相较于使用相同骨干的现有算法,MFP 的性能有显著提升。
- 基于 TPUs 的 TensorFlow 对 MaskFormer 的部分复制
复制了使用 TensorFlow 平台的 MaskFormer 模型,针对 Tensor Processing Units(TPU)进行了优化,解决了非收敛问题、训练缓慢、损失函数适应和 TPU 特定功能集成等挑战,并在 COCO 数据集上 - Mask2Former 风格模型的高效 Transformer 编码器
基于视觉 Transformer 的模型在图像分割任务上取得了显著的改进。然而,这些架构对计算资源的使用可能对部署设备造成负担。为了克服这一挑战,我们引入了 ECO-M2F,即 EffiCient TransfOrmer Encoders - ELEV-VISION-SAM: 综合视觉语言和基础模型用于建筑物最低地板高程的自动估计
该研究通过将 Segment Anything 模型与视觉语言模型相结合,对街景图像进行文本提示图像分割,从而改进了街景图像的分割质量及其在低洼地区的可见性估计模型,从 33% 提高到 56%。这个方法不仅推进了城市分析中的街景图像分割,还 - CVPRBiSeNet 的复仇:高效的多任务图像分割
提出了一种针对图像分割的高效多任务架构 BiSeNetFormer,能够在保持高效和准确性的同时处理多种分割任务,其结果表明 BiSeNetFormer 在模型效率和任务适应性之间构建了桥梁,具有快速、高效和多任务分割网络的显著进展。
- 面向区域级攻击细分任意模型的实用方法
该研究论文提出了一种更实用的区域级攻击方法,攻击者不需要了解精确的用户提示,通过对图像中目标对象上的任意点进行点击,以隐藏对象并使其不受 Segment Anything Models(SAM)的干扰,同时通过谱变换方法使攻击更具可迁移性, - 医学图像中的精确边界分割相互包含机制
基于深度学习的 MIPC-Net 方法用于精确医学图像边界分割,并在公开数据集上表现出优于现有方法的能力。
- SAM-I-Am:用于零样本原子尺度电子显微图分割的语义强化
给定零样本分割技术基础模型,我们提出了 “语义增强” 的概念,通过指导分割过程并调整结果以适应特定领域的期望,实现了最佳分割技术的快速适应。我们将语义增强应用于 Segment Anything Model(SAM)以获取透射电子显微镜的微 - 基于语言导向的领域通用医学图像分割
本文提出了一种基于文本信息的显式对比学习机制,通过使用文本编码器特征来学习更强大的特征表示,以增强模型对数据的理解,从而在不同的分割任务中实现了更强大的性能。
- 深度指令调优针对片段化模型
对于 Segment Anything Model(SAM)的(非)条件图像分割任务,通过研究发现,与点 - 盒引导分割相比,SAM 在文本引导任务上表现较差,因其默认的轻量级遮罩解码器中的浅层融合方案。本文提出了两种深度指令调优方法,一种 - 优化二十一点策略推荐器:关于增强游戏体验的计算机视觉集成的综合研究
这项研究项目旨在应用计算机视觉技术来进行二十一点等赌场游戏中的纸牌检测和识别,以开发一个能够实时检测和准确分类纸牌,并基于当前游戏图像显示最佳移动建议的稳健系统。该研究探讨了使用 K-Means 进行图像分割、纸牌投影重建和特征提取、使用带 - FreeSeg-Diff:基于扩散模型的无需训练的开放词汇分割
该论文研究了基于开源预训练模型的零样本、无需训练的图像分割方法,通过结合不同的小型基础模型,利用扩散模型生成的特征,以及基于 CLIP 模型进行开放性词汇处理,实现了在 Pascal VOC 和 COCO 数据集上超越许多基于训练的方法并与 - 随机耦合神经网络
提出了随机耦合神经网络(RCNN)模型,通过随机失活过程克服了脉冲耦合神经网络(PCNN)的困难,实现了海量神经连接,并在图像分割等应用中展现了鲁棒、高效、抗噪声的出色性能。
- 旋转扫描:医学图像分割的三元 SSM 模块与类 UNet Mamba
通过使用残差 VSS 模块进行深度上下文特征提取,以及使用 Triplet SSM 在空间和通道维度上融合特征,我们的 TM-UNet 在多个数据集上展示了卓越的分割性能,并且相较于之前的 VM-UNet 减少了三分之一的参数。
- 基于边缘检测的深度学习方法用于泪膜高度测量
通过深度学习技术,本论文介绍了一种基于边缘检测辅助标注的自动涙膜高度测量技术。该方法生成的标签较少受主观因素影响,并且比以前的标注方法更高效。使用 Inceptionv3 卷积神经网络作为图像质量评估模型,用于改善瞳孔和涙膜区域的分割,并结 - 水下检测中基于不确定性的主动学习图像分割
使用主动学习方法在水下基础设施检测任务中进行图像分割,并使用互信息和蒙特卡洛 dropout 计算获得采集函数,结果显示采用主动学习方法可以显著降低水下检测任务中分割模型的成本。
- ZoDi: 基于扩散的图像转换的零样本领域自适应
本文提出了一种基于扩散模型的零样本领域自适应方法,名为 ZoDi,它具有两个设计特点:零样本图像转换和模型自适应。通过利用现成的扩散模型将源图像的领域转移到目标领域,我们首先合成目标领域的类似图像,以维持布局和内容,然后在训练模型时使用源图