Oct, 2022

统一视觉与语言提示学习

TL;DR该研究系统研究了文本和视觉提示的参数微调方法。他们提出了一个名为Unified Prompt Tuning(UPT)的方法,通过学习一个微小的神经网络来联合优化跨不同模态的提示,并在11个视觉数据集上进行了强有力的测试,取得了较好的few-shot learning 和domain generalization的效果。