Mar, 2024

Med3DInsight:利用 2D 多模态大型语言模型增强 3D 医学图像理解

TL;DR通过结合现有的 3D 图像编码器和 2D MLLMs,并通过设计的 Plane-Slice-Aware Transformer(PSAT)模块,提出了一种名为 Med3DInsight 的新颖预训练框架,用于增强对 3D 医学图像的理解。实验证明,在两个下游分割和分类任务中,包括使用 CT 和 MRI 模式的三个公共数据集以及与十多个基准模型的比较中,Med3DInsight 取得了最先进的性能,并且可以轻松集成到任何当前的 3D 医学图像理解网络中,显著提高其性能。