ICCVJul, 2023

将视觉和语言编码器融合:针对指代图像分割的参数高效调整

TL;DR我们在密集预测任务和模态之间的交互方面对参数高效调整进行了调查,并且提出了一种名为 Bridger 的新型适配器,以促进跨模态信息交流并将任务特定信息注入预训练模型,并为图像分割设计了轻量级解码器,该方法在具有挑战性的基准测试中只更新了 1.61%至 3.38%的主干参数,并实现了相当或更高的性能。