Jul, 2024

TokenPacker: 多模态 LLM 的高效视觉投影器

TL;DR我们提出了一种新的视觉投影仪,采用粗细方案,通过注入丰富的特征生成压缩的视觉标记,并实现了更高的效率。