Jun, 2023

Quilt-1M:组织病理学的一百万张图像文本配对

TL;DR通过从YouTube等多种资源中收集图像和文本,我们构建了一个大规模的视觉语言数据集Quilt-1M,其中共包含100万个成对的图像和文本样本,这是到目前为止规模最大的组织学图像和文本数据集,并通过微调预训练的CLIP模型在13个 diverse patch-level数据集和跨模态检索任务中优于最先进的模型。