May, 2023
医学视觉语言预训练中的多任务配对掩蔽与对齐建模
Multi-task Paired Masking with Alignment Modeling for Medical
Vision-Language Pre-training
TL;DR该研究提出了一种新的医学图像分析解决方案:基于多任务配对掩模对齐(MPMA)的统一 Med-VLP 框架,其中设计了全局和局部对齐(GLA)模块和记忆增强型跨模态融合(MA-CMF)模块,以实现更全面的跨模态交互,并在全部下游任务中优于以前的方法。