CVPRMar, 2021

多实例字幕生成:从组织病理学教材和文章中学习表征

TL;DRARCH 是一个计算病理学(CP)多实例字幕数据集,包含对一系列染色、组织类型和病理的诊断和形态学描述,我们使用内在维度估计,显示 ARCH 是唯一可以与计算机视觉类比的 MS-COCO Captions 匹敌的 CP 数据集,我们推测在密集的图像字幕上预训练的编码器可以学习可迁移表示,支持这个假设的证据是 ARCH 表示比 ImageNet 功能或通过自我监督或多任务学习仅在病理图像上获得的表示更好地转移至各种病理亚任务,我们发布了我们的最佳模型,并邀请其他研究人员在其 CP 任务上进行测试。