Jun, 2023
医学视觉语言理解和生成的多模型预训练:新基准的实证研究
Multi-modal Pre-training for Medical Vision-language Understanding and
Generation: An Empirical Study with A New Benchmark
TL;DR通过提出一个高质量的医学放射照片数据集(RadioGraphy Captions),本文对医学领域的视觉 - 语言(VL) 预训练(VLP) 进行了深入的实验分析,得出了一些指导未来医学VL任务研究和新的强基准的关键结论。