自我监督的共同学习:对未加工的医疗影像和报告进行处理,实现放射学 AI 监督
本文介绍了一种自我监督方法 - 对遮蔽图像建模、遮蔽语言建模、图像文本匹配和图像文本对齐进行对比学习的 M2I2 方法,应用于医学图像字幕数据集的预训练,并对下游医学 VQA 任务进行微调。该方法在三个公共医学 VQA 数据集上实现了最先进的性能。
Nov, 2022
该研究提出了利用骨骼 X 射线与法语报告的视觉语言预训练来解决骨 X 射线影像学的下游任务。提出了一个实用的处理流程来对法国医学报告进行匿名化和处理。预训练包括来自深度模型编码器的视觉和文本嵌入空间的自我监督对齐。结果的图像编码器用于处理各种下游任务,包括骨关节炎的量化、儿童手腕骨龄的估计、骨折和异常检测。与需要大量人工专家注释的替代方法相比,我们的方法在下游任务上表现出竞争性能。我们的工作是第一项将法国报告整合到用于骨 X 射线表示的嵌入空间的研究,利用了医院中大量的成对图像和报告数据,以在特定语境中依赖通用视觉语言深度模型,为更广泛的医疗应用部署视觉模型作出贡献。
May, 2024
本文提出了 REMEDIS,采用大规模监督式迁移学习和自监督学习的通用结合方式,用于改善医学图像 AI 的鲁棒性和数据效率,并在各种医学成像任务中展示了显著的表现,说明 REMEDIS 可以加速医学成像 AI 的生命周期,从而有助于医学成像 AI 产生广泛的影响。
May, 2022
该研究介绍了一种名为 REviewing FreE-text Reports for Supervision(REFERS)的交叉监督方法,该方法可以从放射学报告中获得免费的监督信号,并且优于现有的预训练方法,具有在放射科学中推广应用的潜力。
Nov, 2021
本文提出了一种新颖的基于机器教学、整合了 DICOM 标准 SR 注释的人工智能模型服务,以及将其集成到开源的 LibreHealth 放射学信息系统(RIS)中。此平台利用主动学习策略,使得放射学家与模型之间可以建立合作关系,并且运用群集学习方法,实现了共享有多个用户的用户特定模型权重的目标。
Mar, 2023
通过利用神经放射学报告中丰富的信息,我们提出了一个自监督的文字 - 视觉框架,通过对脑部 MRI 扫描进行无监督学习,检测临床相关的异常,为自动分类、自动分级等应用提供支持。
May, 2024
近期人工智能的进展使其在初级医疗服务中得到广泛应用,解决了医疗保健领域的需求供应失衡问题。Vision Transformers(ViT)已成为最先进的计算机视觉模型,受益于自注意力机制。然而,与传统的机器学习方法相比,深度学习模型更复杂,常被视为黑匣子,这可能导致人们对其运作方式的不确定性。可解释的人工智能(XAI)是指解释和解读机器学习模型内部运作及其决策的方法,这对医疗领域的决策过程尤为重要。本综述总结了最近 ViT 的进展和解释性方法,以了解 ViT 的决策过程,实现医疗诊断应用的透明性。
Sep, 2023
本文利用 BERT 模型在无标注大语料库中预训练生成上下文表示,进而构建医学无标注文本的自监督学习模型提高判别医学报告的信息提示等级,并取得了显著性能优于 Word2vec 模型的效果。
Dec, 2019
自监督预训练在医学图像诊断任务中通过改善特征表示进而提高了下游任务性能,尤其是在无标注样本数量远远超过有标注样本数量时。该综述总结了近期在 X 射线、计算机断层扫描、磁共振和超声成像领域中应用自监督预训练与全监督学习相比较的研究,最重要的发现是自监督预训练普遍提高了诊断任务的性能。基于综合证据,为考虑使用自监督学习的实践者提供了相关的建议,同时针对当前研究中存在的局限性,提出了未来研究的方向与实践,如将临床知识与理论基础的自监督学习方法结合、在公共数据集上进行评估、扩展对超声成像领域的研究证据,以及表征自监督预训练对泛化性能的影响。
Sep, 2023
本研究旨在展示如何从公共资源如 PubMed 中自动收集医学图像与文本对齐数据,构建用于具体医学任务的高性能视觉语言模型,并解决医学领域中子图到子标题的映射问题。
Apr, 2024