Dec, 2023

使用预训练视觉Transformer和BERT自动生成组织病理学图像报告

TL;DR通过使用预训练的Vision Transformer将整个高分辨率图像编码为4096x4096大小的补丁,并使用预训练的BERT模型进行基于语言建模的解码,我们建立了一个性能良好且可移植的报告生成机制,不仅能生成和评估描述图像的标题,还可以帮助将图像分类为组织类型和患者的性别。