May, 2024

MANTIS: 并行多图像指令调优

TL;DR通过使用学术级资源进行指导调整,我们构建了多弱像素 LMMs,结合了多个单像素视觉语言数据集,证明了以低成本的指导调整构建多弱像素 LMMs 的效果比密集预训练更好。