Dec, 2023

T3D:通过视觉 - 语言预训练实现三维医学图像理解

TL;DRT3D 是为高分辨率 3D 医学图像设计的首个 VLP 框架,通过两个文本感知的预训练任务,即文本感知的对比学习和文本感知的图像恢复,从高分辨率的 3D 医学图像中学习 3D 视觉表示,整合临床知识,拥有在器官和肿瘤分割以及疾病分类等任务中显著优于现有 vSSL 方法的潜力。