May, 2024

AlignGPT: 具有自适应对齐能力的多模态大型语言模型

TL;DR利用新的多模态大型语言模型 AlignGPT,通过在预训练阶段为不同的图像 - 文本对分配不同级别的对齐能力,并在指导微调阶段自适应地组合这些不同级别的对齐能力,以满足不同指令的动态对齐需求,取得了 12 个基准测试的竞争性性能。