使用包含 400 多种疾病知识的视觉语言基础模型进行常见和罕见的眼底疾病识别

Jun, 2024

使用包含 400 多种疾病知识的视觉语言基础模型进行常见和罕见的眼底疾病识别

Common and Rare Fundus Diseases Identification Using Vision-Language Foundation Model with Knowledge of Over 400 Diseases

PDF

Meng Wang, Tian Lin, Kai Yu, Aidi Lin, Yuanyuan Peng...

TL;DR本文介绍了一种使用超过 400 种眼底疾病信息的视网膜视觉语言基础模型（RetiZero），该模型通过收集 341,896 幅眼底图像和相关文本描述，从 29 个公开数据集、180 本眼科书籍和在线资源中获取。RetiZero 在零样本视网膜疾病识别、图像检索、内部领域和跨领域视网膜疾病分类以及有限样本微调等各种下游任务中取得了出色的性能，并能在不需要重新训练模型的情况下，通过零样本和图像检索方法实现与有经验的眼科医生相媲美的临床评估，从而加强了 RetiZero 基础模型在临床实施中的应用能力。

Abstract

The current retinal artificial intelligence models were trained using data with a limited category of diseases and limited knowledge. In this paper, we present a retinal vision-language foundation model (retizero

retinal artificial intelligence models retizero fundus diseases zero-shot retinal disease recognition clinical implementation

发现论文，激发创造

RET-CLIP: 一种用临床诊断报告进行预训练的视网膜图像基准模型

本文开发了一种 CLIP 风格的视网膜图像基础模型 RET-CLIP，该模型在 193,865 名患者的数据集上进行特训，能够在四个关键的诊断类别中优于现有基准，包括糖尿病视网膜病变，青光眼，多疾病诊断和多疾病的多标签分类。

May, 2024

眼部疾病智能识别基准测试：一镜到底的多病检测

本研究通过建立包含 8 种常见眼疾的数据集，使用深度神经网络进行多疾病分类的实验，发现提高网络规模不能为多疾病分类带来好结果，需要采用良好结构的特征融合方法。

Feb, 2021

使用一半的数据和 400 倍少的计算资源训练高性能视网膜基础模型

人工智能在医学领域具有巨大潜力，但传统上受限于缺乏大量的数据集来训练模型。我们提出了一种新颖的 Token Reconstruction 目标，用于训练 RETFound-Green，这是一个只使用了 75,000 张公开可用图像和 400 倍较少计算资源进行训练的视网膜基础模型。RETFound-Green 在效率和性能方面表现出色，并且可以用于其他领域的扩展。

Apr, 2024

自我监督的机器学习在医疗专家匮乏的多种眼底疾病诊断中的应用

我们提出了一个通用的无监督机器学习框架，可以处理不同的未标记的眼底图像，达到了超过现有监督方法的 AUC，并且甚至超过了单个人类专家的表现。此外，我们的模型在来自不同地区、种族和多台相机或设备的异构图像源或质量的各种数据集上都适应良好。我们的方法提供了一个无需标签的通用框架来诊断眼底疾病，这可能有利于早期筛查视力受损风险的远程医疗计划。

Apr, 2024

MM-Retinal: 知识增强的基础预训练及其在眼底图像文本专业领域中的应用

提出了 MM-Retinal 基金 us 图像分析模型，该模型通过多模态数据集以及 KeepFIT 知识增强基础预训练模型，实现了六个未见任务中的最先进性能，并在零样本和少样本场景中展现了出色的泛化能力。

May, 2024

基于视网膜的基础语言 - 图像模型（FLAIR）：通过文本监督编码专业知识

FLAIR 是一个用于通用视网膜底层图像理解的预训练视觉语言模型，它整合了专家领域知识，具有强大的泛化能力和优于全面训练模型的性能，尤其在少样本情况下，FLAIR 表现出色。

Aug, 2023

自适应多尺度视网膜诊断：基于混合三模型方法的综合底片多疾病检测，利用迁移学习和孪生网络

研究开发了混合三元网络模型算法，通过使用包含基于传统转移学习的 CNN 模型、两阶段 CNN 模型和孪生网络的三个特征组件提取特征，以及集成机器学习算法进行诊断，实现了对 12 种常见和罕见眼病的准确诊断，其平均准确率为 97%，AUC 得分为 0.96。该诊断工具为全球化早期发现常见和罕见眼病提供了稳定、适应性强、经济高效、易用和快速的解决方案。

May, 2024

结合基于分割的血管增强和深度学习特征的一种改进的视网膜疾病诊断方法

该论文提出了一种快速、客观、准确的诊断与视网膜底层图像相关疾病的方法，采用多分类研究正常样本和 13 类疾病样本在 STARE 数据库上，测试集准确率达到 99.96%，并与其他研究相比取得了最高准确率。创新地提出 “基于分割的血管增强（SVE）” 方法，经比较深度学习模型在 SVE 图像、原始图像和平滑 Grad-CAM ++ 图像上的分类性能后，提取 SVE 图像的深度学习特征和传统特征并输入到九个元学习器进行分类，结果表明我们提出的 UNet-SVE-VGG-MLP 模型在 STARE 数据库上对与视网膜底层图像相关疾病的分类具有最佳性能，测试集的整体准确率达到 99.96%，14 个类别的加权 AUC 为 99.98%。该方法可实现视网膜底层图像相关疾病的快速、客观、准确的分类与诊断。

May, 2024

使用 Transformer 进行多标签视网膜疾病分类

该研究提出了一种新颖的多标签分类系统，用于检测来自各种来源的眼底图像中的多种视网膜疾病，并构建了一个新的多标签眼底疾病数据集（MuReD 数据集），并使用基于 transformer 的模型进行图像分析和决策制定，实验结果显示该系统较同类方法的 AUC 分数在疾病检测和疾病分类方面分别提高了 7.9％和 8.1％。

Jul, 2022

使用深度学习在超广角眼底图像中检测多种视网膜疾病：数据驱动相关区域识别

我们使用全局可解释性方法建立了一个多疾病的深度学习模型来检测超广角成像中的视网膜疾病，发现在这些图像中最重要的区域是后极区域，只利用后极区域周围 10% 的图像即可实现与使用整个图像相当的性能。

Mar, 2022