Aug, 2024

5%>100%:打破视觉识别任务全微调性能的桎梏

TL;DR本研究解决了现有视觉delta微调方法在对象检测和分割等挑战性任务中无法超越全微调的局限性。我们提出了一种新颖的多认知视觉适配器(Mona)微调方法,该方法通过引入多个视觉友好的过滤器和缩放归一化层,显著提升了视觉信号处理能力。实验结果证明,Mona在多项视觉任务中性能超越全微调,展示了其在预训练模型利用方面的优势。