BriefGPT.xyz
大模型
Ask
alpha
关键词
efficient mllm
搜索结果 - 2
TinyChart:使用视觉令牌合并和思维程序学习的高效图表理解
TinyChart 是一个有效的 MLLM 图表理解框架,仅含 3B 个参数,通过采用思维程序(PoT)学习策略和视觉令牌合并模块,成功解决了图表理解过程中的计算负担和高分辨率图像的视觉特征序列长度问题,并在多个图表理解任务中达到了最先进性
→
PDF
2 months ago
Cobra: 扩展 Mamba 至多模态大型语言模型以实现高效推理
通过将高效的 Mamba 语言模型引入视觉模态,Cobra 实现了线性计算复杂度的多模态大型语言模型,其在现有的计算效率高的方法上表现出极具竞争力的性能,并且具有更快的速度;同时,Cobra 在克服视觉错觉和空间关系判断方面表现出色,甚至与
→
PDF
3 months ago
Prev
Next