Jun, 2023

Quilt-1M:组织病理学的一百万张图像文本配对

TL;DR通过从 YouTube 等多种资源中收集图像和文本,我们构建了一个大规模的视觉语言数据集 Quilt-1M,其中共包含 100 万个成对的图像和文本样本,这是到目前为止规模最大的组织学图像和文本数据集,并通过微调预训练的 CLIP 模型在 13 个 diverse patch-level 数据集和跨模态检索任务中优于最先进的模型。