Mar, 2024

关于 [V]-Mamba 的低样本迁移能力

TL;DR本文研究了大规模神经网络在少样本迁移学习中的能力,通过对 [V]-Mamba 模型与 ViTs 模型在不同少样本数据预算和高效迁移方法下的性能比较,发现 [V]-Mamba 在线性探测(LP)迁移方案下表现优于或等同于 ViTs,而在视觉提示(VP)迁移方法下表现较弱或类似于 ViTs,同时 [V]-Mamba 模型的规模与迁移方案之间存在弱正相关性。这项初步分析为进一步研究 [V]-Mamba 变体和 ViTs 之间的差异,以及它们的能力提供了基础。