Jun, 2024

Mamba 或 RWKV:探索高质量和高效率的分段任意模型

TL;DR通过探索不同的线性注意力架构,设计了一种高效的分割模型 RWKV-SAM,具有最佳的精度和效率。同时,利用多尺度令牌设计了一个高质量的解码器来获取高质量的蒙版,并在各种高质量的分割数据集上训练了一个高效且高质量的模型。在效率和分割质量方面,RWKV-SAM 相对于 Transformer 和其他线性注意力模型表现出色,并超过了最近的视觉模型 Mamba。