Apr, 2023

Instruction-ViT: ViT 中用于指令学习的多模态提示

TL;DR本篇论文研究了采用提示(prompt)对图片进行分类的方法,通过引入多模质询与 fine-tuning 相结合的方式,提高了图片分类的性能和领域适应性。