- 科尔莫戈洛夫-阿诺德卷积:设计原则与实证研究
本文探讨了 Kolmogorov-Arnold Networks 在计算机视觉领域的应用,提出了参数高效的设计和微调算法,并在图像分类和分割任务中取得了最新成果。
- 自适应适应性风险控制
基于 Gibbs 等人最近的研究工作 [2023],我们提出一种方法来实现对统计风险(损失函数的期望值)的近似条件控制,通过适应测试样本的困难程度,实现了对回归和分割任务的细粒度控制,通过持续监测和调整这些参数,我们可以达到比传统风险控制方 - CVPRAlignSAM: 通过强化学习将 Segment Anything 模型与开放环境对齐
通过强化学习的自动提示方法,AlignSAM 将 Segment Anything Model (SAM) 与开放背景进行对齐,以拓展其在不同下游任务中的适用性,同时保持其参数不变。AlignSAM 通过与基本模型的交互,启动提示代理逐步改 - 针对医学图像通用分割的混合双金字塔 Transformer-CNN 的注意力门控重新思考
本研究提出了一种新型混合 CNN-Transformer 分割架构 (PAG-TransYnet),通过在双金字塔混合编码器中利用注意力门,利用金字塔输入突出显示不同尺度的突出特征,将 PVT Transformer 引入以捕获多种分辨率的 - CVPR红队测试分段一切模型
通过对城市道路仪表盘图像应用恶劣天气条件和雨滴,测试了细分任何模型在多个挑战性任务中的影响,通过诸多测试方法和分析表明需要加强图像细分基础模型的安全措施。
- 基于语言导向的领域通用医学图像分割
本文提出了一种基于文本信息的显式对比学习机制,通过使用文本编码器特征来学习更强大的特征表示,以增强模型对数据的理解,从而在不同的分割任务中实现了更强大的性能。
- 使用低秩适配器从视觉基础模型进行混合精度 Supernet 训练
对于大型和高性能的视觉基础模型(Vision Foundation Models,VFMs)进行任意位操作(BitOPs)的压缩,以在各种硬件上部署。我们提出了将 VFM 微调为混合精度量化超网络的方法,该超网络进行神经架构搜索(NAS), - PSALM: 基于大型多模型的逐像素分割
PSALM 是基于大型多模态模型(LMM)的强大扩展,用于解决分割任务的挑战,通过引入掩码解码器和精心设计的输入模式来处理各种分割任务,并且能够生成和分类分割掩码,支持多个数据集和任务的联合训练,具有卓越的性能和任务泛化能力,对图像分割领域 - OMG-Seg:一个模型足够好吗?适用于所有分割任务?
本论文提出了一种名为 OMG-Seg 的基于 Transformer 的编码器 - 解码器架构,通过特定任务的查询和输出,能够支持十多个不同的分割任务,并且在各种任务和数据集中显著减少计算和参数开销,同时评估了任务之间的互动影响和关联
- PMFSNet:极化多尺度特征自注意网络用于轻量级医学图像分割
带有少于 100 万个参数的模型,PMFSNet 在各种分割任务中实现了卓越的性能,同时避免了较大模型中的计算冗余。
- 使用统计距离学习评委间差异性,提升概率分割能力
在医学成像领域,我们提出了一种用于生物医学图像分割的 PULASki 方法,它准确地捕捉多个专家注释之间的变异性,即使在小数据集中也是如此。我们的方法利用基于统计距离的改进损失函数在条件变分自动编码器结构(概率 UNet)中,对比于标准的交 - RadImageGAN -- 用于医学成像的多模态数据集规模的生成式人工智能
RadImageGAN 是第一个多模态放射学数据生成器,通过使用真实的 RadImageNet 数据集训练 StyleGAN-XL 来生成高分辨率的合成医学图像数据,以应对医学图像深度学习中的数据稀缺问题,并提高模型性能和降低分割任务中的标 - 重新思考开放词汇分割的评估指标
评估在开放词汇分割中采用的评估指标存在问题,即评估过程仍然严重依赖于零样本或交叉数据集流水线上的闭集指标,而未考虑预测和实际类别之间的相似性。为了解决这个问题,我们首先通过综合定量分析和用户研究使用 WordNet 语言统计、文本嵌入和语言 - 使用 DUCK-Net 进行息肉图像分割
我们提出了一种新型的监督卷积神经网络架构 “DUCK-Net”,能够从少量的医学图像中有效学习和概括,以执行准确的分割任务。我们的模型利用编码器 - 解码器结构、残差下采样机制和自定义卷积块,以在编码器段的多个分辨率上捕获和处理图像信息。我 - StochGradAdam:利用随机梯度采样加速神经网络训练
该研究论文介绍了深度学习优化领域中的 StochGradAdam 优化器,它是 Adam 算法的一种新变体,核心是梯度采样技术。该方法不仅确保了稳定的收敛性,还充分利用了选择性梯度考虑的优势,通过减轻嘈杂或异常数据的影响以及增强损失函数空间 - 增强医学图像分割的基础模型多提示微调技术
我们引入了一种新颖的微调框架,通过批处理基于真实掩蔽的边界框引入批量提示策略,以提高 Segment Anything Model 在医学图像上的性能表现和广泛的分割任务中解决医学图像中常见的复杂性和模糊性。
- 基于自监督学习从解剖学中学习的医学成像基础模型
通过自我监督学习策略,利用人体解剖的分级性质和组成性,该模型提供了与全 / 自我监督方法相比改进了 9% 到 30% 的分割任务性能以及增强了注释效率,并且能够更好地理解人体解剖学。
- PARTICLE: 粒子:细粒度识别的部分发现和对比学习
我们基于自监督学习开发了细粒度分类和分割任务的表示优化技术,通过识别部分特异变化改进了 fine-grained 分类,在卷积和视觉变换网络中聚类像素表示,利用部分中心化学习和对比在图像中对部分进行聚类,并在多个数据集上展示了在图像分类和部 - AMLP:自适应遮罩损伤区域修补的自监督医学图像分割
基于自监督掩蔽图像建模的方法在自然图像上取得了有希望的结果,但将这样的方法直接应用于医学图像仍然具有挑战性。本文提出了一种新颖的自监督医学图像分割框架,名为自适应掩蔽病变补丁(AMLP)。通过设计 Masked Patch Selectio - 是否进行预训练?组织病理学语义分割领域专用预训练的案例研究
使用不同领域预训练模型对组织学影像进行初始化可显著提高疾病分类和细胞分割的效果,尤其对于腺体分割任务有显著的改善,而细胞分割任务则无明显改善。