May, 2024

VLSM-Adapter: 用轻量级模块高效地微调视觉语言分割

TL;DR基于 transformer 编码器,我们引入了一种称为 VLSM-Adapter 的新型适配器,它可以使用预训练的视听分割模型进行微调,我们的实验证明,仅有 300 万可训练参数的 VLSM-Adapter 优于最先进的技术,并且与上限末端微调具有可比性。