Nov, 2023

基于预训练的视觉Transformer的组织病理学图像自动报告生成

TL;DR使用一个现有的预训练Vision Transformer,通过两步过程对全幻灯片图像(WSI)的4096x4096大小的补丁进行编码,并将其作为编码器和LSTM解码器用于报告生成,我们可以构建一个相当高效和可移植的报告生成机制,考虑到整个高分辨率图像,而不仅仅是补丁。我们还能够使用来自现有强大的预训练分层Vision Transformer的表示,在零样本分类和报告生成方面显示其实用性。