BriefGPT.xyz
Jun, 2024
多模态任务向量实现大规模多模态上下文学习
Multimodal Task Vectors Enable Many-Shot Multimodal In-Context Learning
HTML
PDF
Brandon Huang, Chancharik Mitra, Assaf Arbelle, Leonid Karlinsky, Trevor Darrell...
TL;DR
通过利用内插的大型多模态模型中的多模态任务向量,我们的研究工作实现了多模态的多射击上下文学习,并证明这些提取出的多模态任务向量可以随着压缩射击数的增加而提高性能,并且可以推广到类似的领域任务而不需要额外的上下文长度进行推理。
Abstract
The recent success of
interleaved large
multimodal
models
(LMMs) in few-shot learning suggests that
in-context learning
(ICL) with many ex
→