Nov, 2023

AiluRus:一个用于密集预测的可扩展 ViT 框架

TL;DR通过自适应分辨率和聚类算法,提出一种用于处理密集预测任务中长序列的视觉 Transformer 方法,实现对低分辨率和高分辨率区域的区分,从而加速模型并获得有希望的表现。