Dec, 2023

G2D:全球到密集射线学习的视觉-语言预训练

TL;DR该论文提出了一种名为G2D的新型VLP框架,通过伪分割任务与全局视觉语言对齐相结合,学习得到密集且语义化的图片表示,以在6个医学成像任务和25种疾病中取得明显改进的性能,尤其在细粒度的语义分割任务中,甚至在只使用1%的训练数据进行微调时,也能超过同类模型的性能。