Apr, 2024

iVPT:通过跨层动态连接改进视觉提示调整中的任务相关信息共享

TL;DR最近的进展显示出了将预训练的视觉转换器应用到各种下游任务中的视觉提示调整(VPT)的巨大潜力。本文提出了一种创新的 VPT 方法,即 iVPT,它通过从相邻层的输入提示令牌中引入跨层动态连接(CDC),实现了任务相关信息的有效共享,并采用动态聚合(DA)模块促进了层间信息的选择性共享。基于这些基础,iVPT 引入了一种关注强化(AR)机制,通过自动识别显著的图像令牌,并以增加的方式与提示令牌进一步增强。对 24 个图像分类和语义分割基准的大量实验证明了所提出的 iVPT 相对于现有最先进方法的优势。