BriefGPT.xyz
Ask
alpha
关键词
multi-instance visual prompt generator
搜索结果 - 1
通过多实例视觉提示生成器增强多模态大语言模型以实现视觉表征丰富化
本研究探讨了多模态大型语言模型的性能,通过利用视觉适配器将视觉表示与语言模型相结合,在多个视觉语言任务中取得了最先进的表现。研究还提出了一种通用组件,名为多示例视觉提示生成器(MIVPG),通过利用图像或样本相同的补丁之间的实例相关性,将丰
→
PDF
a month ago
Prev
Next