Jun, 2023
Quilt-1M:组织病理学的一百万张图像文本配对
Quilt-1M: One Million Image-Text Pairs for Histopathology
Wisdom Oluchi Ikezogwo, Mehmet Saygin Seyfioglu, Fatemeh Ghezloo, Dylan Stefan Chan Geva, Fatwir Sheikh Mohammed...
TL;DR通过从YouTube等多种资源中收集图像和文本,我们构建了一个大规模的视觉语言数据集Quilt-1M,其中共包含100万个成对的图像和文本样本,这是到目前为止规模最大的组织学图像和文本数据集,并通过微调预训练的CLIP模型在13个 diverse patch-level数据集和跨模态检索任务中优于最先进的模型。