Jun, 2024

iWISDM: 在大规模的多模态模型中评估指令遵循

TL;DR通过 iWISDM 环境,我们编制了三个不同复杂度的指令跟踪视觉任务基准,并评估了几种新开发的多模态模型,结果显示多模态模型的指令遵循能力与人类存在较大差距。