May, 2024

MSPE:多尺度补丁嵌入激励视觉变换器适应任何分辨率

TL;DR本研究提出了一种名为 Multi-Scale Patch Embedding(MSPE)的方法,通过优化贴片嵌入,增强模型对分辨率变化的适应能力,在图像分类、分割和检测任务中通过消除对原始图像的调整,显著提高低分辨率输入的性能,并与现有方法在高分辨率输入方面表现相当。