Mar, 2024

LocalMamba:具有窗口选择性扫描的视觉状态空间模型

TL;DR通过优化顺序建模的扫描方向,并采用局部扫描策略和动态方法,本文提出了 Vision Mamba (ViM) 模型的改进方法,大幅度提高了图像表示的效果。