Jun, 2024

医疗视觉通才:在背景下统一医学图像任务

TL;DR本研究介绍了医学视觉通用模型(MVG),它是第一个能够在统一的图像生成框架内处理各种医学图像任务的基础模型,包括跨模态合成、图像分割、降噪和修复等。通过将这些任务作为图像生成过程,在参考图像 - 标签对和输入图像的条件下实现灵活统一各种任务的方法,并结合蒙版图像建模和自回归训练的混合方法,以获得最稳健的性能。我们建立了第一个全面的通用医学视觉基准,涵盖了 13 个数据集和四种成像模态(CT、MRI、X 光和微超声),结果表明 MVG 具有优异的性能,在各种医学成像任务中表现优于现有的视觉通用模型,并且 MVG 在更多样化任务的训练下表现出可扩展性强,甚至在只有少量特定任务样本的情况下也能适应未见过的数据集。