Dec, 2023

使用预训练视觉 Transformer 和 BERT 自动生成组织病理学图像报告

TL;DR通过使用预训练的 Vision Transformer 将整个高分辨率图像编码为 4096x4096 大小的补丁,并使用预训练的 BERT 模型进行基于语言建模的解码,我们建立了一个性能良好且可移植的报告生成机制,不仅能生成和评估描述图像的标题,还可以帮助将图像分类为组织类型和患者的性别。