Apr, 2023

RSIR Transformer:使用随机采样窗口和重要区域窗口的分层视觉 Transformer

TL;DR本文介绍了 RS-Win 和 IR-Win 两种新的注意力机制,用于增强分层视觉 Transformer 的全局建模能力,同时也提高了自我注意模块对图像重要区域的关注能力,这个新的设计有助于在通用视觉任务中提高 RSIR-Win Transformer 的性能。