CVPROct, 2022

MaPLe: 多模态提示学习

TL;DR本研究提出了多模态提示学习 (MaPLe) 的方法,旨在通过不同的早期阶段分别学习视觉和语言分支的独立提示,以逐步建模分阶段的特征关系,并促进视觉 - 语言提示之间的强耦合,以改善 CLIP 的下游任务结果。结果表明,该方法具有良好的性能和广泛的应用前景。