Apr, 2024

TinyChart:使用视觉令牌合并和思维程序学习的高效图表理解

TL;DRTinyChart 是一个有效的 MLLM 图表理解框架,仅含 3B 个参数,通过采用思维程序(PoT)学习策略和视觉令牌合并模块,成功解决了图表理解过程中的计算负担和高分辨率图像的视觉特征序列长度问题,并在多个图表理解任务中达到了最先进性能。