Jun, 2022
通过分层无监督学习将 Vision Transformer 扩展到千兆像素图像
Scaling Vision Transformers to Gigapixel Images via Hierarchical
Self-Supervised Learning
TL;DR本文提出了一种新的ViT架构(HIPT),它利用自我监督学习来学习高分辨率图像表示,并利用WSI固有的分层结构进行分层预训练。通过在33种癌症类型上对10,678个gigapixel WSI、408,218个4096x4096图像和104M个256x256图像进行预训练,证明了HIPT在癌症亚型划分和生存预测方面优于当前最先进的方法。