探索基础模型在眼底图像上的迁移性：应用于高血压性视网膜病变

Jan, 2024

探索基础模型在眼底图像上的迁移性：应用于高血压性视网膜病变

Exploring the Transferability of a Foundation Model for Fundus Images: Application to Hypertensive Retinopathy

Julio Silva-Rodriguez, Jihed Chelbi, Waziha Kabir, Hadi Chakor, Jose Dolz...

TL;DR使用基于 Imagnet 预训练的深度学习模型是处理医学图像分类中数据稀缺性的传统解决方案。然而，相关文献支持此策略可能由于领域之间的高差异性而带来有限的增益。目前，适应领域专业化基础模型的范式证明是一种有前景的替代选择。本文通过 CGI-HRDC 高血压性视网膜病变诊断的眼底图像挑战赛，评估了最近发布的视觉 - 语言基础模型 FLAIR 的可迁移性。我们探索了使用 FLAIR 特征作为眼底图像分类的起点的潜力，并将其性能与基于 Imagenet 初始化的两种流行的迁移学习方法（线性探测和微调）进行了比较。我们的实证观察表明，在任何情况下，传统策略的使用都提供了性能增益。相比之下，直接从 FLAIR 模型进行迁移可以获得 2.5% 的增益。当对整个网络进行微调时，性能差距增加到 4%。在这种情况下，我们展示了通过使用分类器的线性探测初始化避免特征退化，以最佳方式重用丰富的预训练特征。尽管使用线性探测的直接迁移性仍然提供有限的性能，但我们相信 FLAIR 等基础模型将推动基于深度学习的眼底图像分析的发展。

Abstract

Using deep learning models pre-trained on Imagenet is the traditional solution for medical image classification to deal with data scarcity. Nevertheless, relevant literature supports that this strategy may offer

deep learning medical image classification knowledge transfer flair model transfer learning

发现论文，激发创造

基于视网膜的基础语言 - 图像模型（FLAIR）：通过文本监督编码专业知识

FLAIR 是一个用于通用视网膜底层图像理解的预训练视觉语言模型，它整合了专家领域知识，具有强大的泛化能力和优于全面训练模型的性能，尤其在少样本情况下，FLAIR 表现出色。

Aug, 2023

大型基础模型在诊断中数据集质量依然令人关注吗？

使用预训练的大型基础模型（LFM）和自我监督学习框架为视网膜图像开发了一个 LFM，该模型在多个数据集上对视网膜疾病的诊断表现出良好的性能；此外，研究发现 LFM 对于数据集质量问题（包括图像质量和数据集偏差）表现出更强的韧性，而整体微调是减轻数据集质量问题影响的有效适应器。

May, 2024

基于迁移学习的小数据集糖尿病视网膜病变检测

研究探讨了如何利用预训练的深度卷积神经网络 (Inception-V3) 中的 Inception 模块进行糖尿病视网膜病变检测，以解决深度学习在医学数据分类问题中的标记数据不足的挑战。通过利用 Kaggle 糖尿病视网膜病变分类挑战数据集的子集，作者训练了预训练 Inception-V3 模型，取得了不错的结果。该研究展示了在标记数据不足的情况下如何利用迁移学习来进行医学图像分类中的大规模筛选和准确性问题。

May, 2019

深度学习创新在糖尿病视网膜病变诊断中的应用：迁移学习和 DiaCNN 模型的潜力

通过使用深度学习和迁移学习技术，本研究提出了一种新的诊断糖尿病视网膜病变的方法，与传统的诊断方法相比，具有更高的准确性，对于早期的诊断、治疗和预防失明至关重要。

Jan, 2024

MM-Retinal: 知识增强的基础预训练及其在眼底图像文本专业领域中的应用

提出了 MM-Retinal 基金 us 图像分析模型，该模型通过多模态数据集以及 KeepFIT 知识增强基础预训练模型，实现了六个未见任务中的最先进性能，并在零样本和少样本场景中展现了出色的泛化能力。

May, 2024

用生成模型解耦视网膜图像的表示

通过引入新颖的人群模型和基于距离相关性的解缠结损失函数，我们成功实现了视网膜底图像的控制性和高度逼真的生成，并揭示了患者属性和技术混杂因素在图像生成中的复杂关系。

Feb, 2024

自然领域基础模型在医学图像分类中是否有用？

通过对五种先进的基础模型（SAM、SEEM、DINOv2、BLIP 和 OpenCLIP）在医学图像分类任务中的可转移性进行评估，我们的研究显示了混合的结果。尽管 DINOv2 在不断超越 ImageNet 预训练的标准实践方面表现出色，但其他基础模型未能始终超越此已建立的基线，这表明它们在医学图像分类任务中的可转移性存在限制。

Oct, 2023

RET-CLIP: 一种用临床诊断报告进行预训练的视网膜图像基准模型

本文开发了一种 CLIP 风格的视网膜图像基础模型 RET-CLIP，该模型在 193,865 名患者的数据集上进行特训，能够在四个关键的诊断类别中优于现有基准，包括糖尿病视网膜病变，青光眼，多疾病诊断和多疾病的多标签分类。

May, 2024

RetiGen：利用多视场眼底图像进行广义视网膜诊断的框架

该研究介绍了一种用于增强医学图像领域普适性的新框架，特别关注于利用未标记的多视角彩色底片照片。与依赖单视图成像数据且在不同临床场景中通用性有挑战的传统方法不同，我们的方法利用未标记的多视角成像数据中的丰富信息来提高模型的稳健性和准确性。通过结合类别平衡方法、测试时间适应技术和多视角优化策略，我们解决了常常影响机器学习模型在实际应用中性能的关键问题 —— 领域偏移。与现有基线方法和最先进方法相结合，实验证明我们的方法在与其它领域普适性和测试时间优化方法的比较中始终表现出色。我们还展示了我们的在线方法改进了所有现有技术。我们的框架改进了领域普适性能力，通过促进对新的未知数据集的在线适应，为实际部署提供了实用解决方案。我们的代码可在此 https URL 中获得。

Mar, 2024

喉部血管分类的两步异构迁移学习的问题与改进分析

在该研究中，我们探讨了使用糖尿病视网膜彩色照片作为中间领域进行两步异构学习（THTL）以对喉血管图像进行分类的有效性，并发现通过分析层级类激活图（LayerCAM），采用步骤式微调（SWFT）方法可以显著提高分类准确性。

Feb, 2024