- MoVL: 探索预训练模型在医学图像任务中的领域自适应应用的融合策略
对于医学图像分类,本研究引入了视觉提示技术(VP)以填补输入医学图像与常规预训练视觉模型之间的差距,并通过设计包含分类损失和差异损失的联合学习损失函数来进行联合训练,命名为 MoVL(混合视觉提示和线性探测)。实验证明,MoVL 具有实现完 - VLSM-Adapter: 用轻量级模块高效地微调视觉语言分割
基于 transformer 编码器,我们引入了一种称为 VLSM-Adapter 的新型适配器,它可以使用预训练的视听分割模型进行微调,我们的实验证明,仅有 300 万可训练参数的 VLSM-Adapter 优于最先进的技术,并且与上限末 - 医学图像分类的轻量级神经架构搜索模型
通过基于双层优化的稀疏概率生成方法,Z0-DARTS + 提高了搜索效率,与最先进的解决方案相比,匹配了状态技术的准确性,并将搜索时间缩短了三倍。
- RepVGG-GELAN:通过 VGG-STYLE ConvNets 增强的 GELAN 用于脑肿瘤检测
本研究提出了一种新的基于 YOLO 架构,采用 RepVGG 增强的 RepVGG-GELAN 算法用于医学图像中的脑肿瘤检测,实验结果表明,该算法在精确性和速度方面优于现有方法,为准确高效的医学图像脑肿瘤检测提供了一个最新的解决方案。
- ConPro: 使用对比学习和偏好优化学习医学图像的严重程度表示
通过对医学图像中显示的严重程度的理解是至关重要的,可以作为临床评估、治疗和评估纵向进展的关键指南。本文提出了一种新颖的表示学习方法 ConPrO,用于使用对比学习整合的偏好优化在医学图像中进行严重程度评估,与传统的对比学习方法不同,ConP - 轻量级全局推理视网膜层分割
本文提出了一种轻量级网络,用于光学相干断层扫描图像的视网膜层分割,并通过多尺度特征提取和变换块对特征图的语义信息进行全面利用和全局推理能力的提升,并通过多尺度不对称注意(MAA)模块在每个编码器尺度上保留语义信息,实现了比当前最先进的 Tr - ChEX:胸部 X 光片的交互式定位和区域描述
通过结合文本提示和边界框,我们提出了一种新颖的多任务架构和训练方法,用于解决医学图像的报告生成和解释性问题。我们称之为胸部 X 射线解释器(ChEX)。通过在 9 个不同的胸部 X 射线任务中进行评估,包括定位图像解释和报告生成,我们展示了 - 适应人工智能性病症状检测工具以检测 Mpox:HeHealth 经验
人工智能应用于疫情管理和医学图像的识别、分类和诊断方面显示出潜力。针对猴痘(Mpox)全球爆发,HeHealth.ai 团队利用现有工具开发了一种借助人工智能方法通过数字筛查对于患有症状的猴痘进行筛查的测试。
- 多支路生成模型用于多通道成像及其 PET/CT 联合重建的应用
通过多分支生成模型的学习协同重建医学图像的概念验证方法,利用变分自编码器(VAEs)和生成对抗网络(GANs)学习同时对成对图像,实现有效的去噪和重建;通过将训练好的模型引入正则项来评估图像与模型之间的距离,类似于多通道字典学习(DiL), - 用局部扩散解决图像翻译中的结构幻觉
通过局部超出分布区域划分和分离图像生成过程,本研究提出了一个无需训练的扩散模型,有效减少图像幻觉和误诊,减少真实世界医学和自然图像数据集中的误诊率分别达到 40% 和 25%,同时与各种预训练的扩散模型兼容。
- 光学相干断层扫描图像的对比非配对图像转换的解剖条件
通过图像到图像(I2I)转换对不同模态的医学图像进行统一分析,解决因信息差异导致的非成对映射挑战。为了恢复语义一致性,本研究在对比学习非成对 I2I 转换(CUT)方法的基础上,通过额外的分割解码器支持风格解码器,提高样式转换图像与目标分布 - SM2C:利用元伪标签和混合图像提升医学图像的半监督分割
最近,基于机器学习的语义分割算法展示出了在医学图像中精确分割区域和轮廓的潜力,从而能够准确定位解剖结构和异常情况。然而,由于训练数据的有限性,过拟合几乎是不可避免的。因此,本研究引入了一种名为 SM2C 的新方法,通过扩大图像尺寸、多类别混 - 医学图像扩散分割分析
对扩散分割与图像生成之间的区别进行分析和讨论,重点关注训练行为,评估直接用于分割的扩散分割架构的表现,以及不同医学分割任务对扩散分割行为的影响及相应的扩散过程的调整方法。通过这些分析,旨在为未来扩散分割方法的设计和评估提供深入见解。
- ContourDiff:带轮廓引导扩散模型的非配对图像转换
提出了一个新的框架 ContourDiff,通过利用图像的域无关解剖轮廓表示,实现对医学图像的跨模态(如 CT 到 MRI)准确翻译,并确保保留解剖内容,进而在图像转换和分割模型中取得了显著优于其他方法的性能。
- 一种新的体数据隐式神经表示
提出了一种新的隐式神经表示压缩方法,利用 Lanczos 降采样方案、SIREN 深度网络和 SRDenseNet 高分辨率方案,实现了高压缩比和良好的图像重建质量,同时降低了训练时间和 GPU 内存成本。
- 公平医学图像分类的通用无偏编辑
在 AI 领域中,我们提出了一种名为 UDE 的 U (niversal) D (ebiased) E (diting) 策略,其通过生成 UDE 噪声来掩盖医学图像中的虚假相关性,解决了使用 FM API 时医学图像偏见的挑战,并展示了该 - 卷积神经网络通过决策树对特征图进行知识蒸馏
通过提取卷积神经网络的最终层中的特征并使用决策树进行训练,我们提出了一种蒸馏方法来解释深度神经网络的推理,展示了决策树在解释卷积神经网络决策时的表现与最小复杂度的卷积神经网络相当好。
- AAAIDrFuse: 临床多模态融合学习非配备模态和模态不一致性的解耦表示
将电子健康档案(EHR)和医学影像相结合对临床医生在诊断和预测预后中至关重要。作者提出了一种名为 DrFuse 的方法,通过分离跨模态的共享特征和每个模态内的独特特征来解决缺失模态和模态不一致的问题,在真实世界的大规模数据集上验证了该方法的 - AnatoMix:面向多器官分割的解剖感知数据增强
通过深度学习的数据增强策略,我们提出了 AnatoMix 方法,可以增加多器官分割数据集的泛化能力,从而在公共 CT 数据集上实现了更高的平均 Dice 值(76.1)与基准方法(74.8)相比。
- 喉部血管分类的两步异构迁移学习的问题与改进分析
在该研究中,我们探讨了使用糖尿病视网膜彩色照片作为中间领域进行两步异构学习(THTL)以对喉血管图像进行分类的有效性,并发现通过分析层级类激活图(LayerCAM),采用步骤式微调(SWFT)方法可以显著提高分类准确性。