Jun, 2023

LVLM-eHub:面向大型视觉语言模型的全面评估基准

TL;DR本文介绍了一个 LVLM-eHub 综合评估平台,使用 6 种多模态能力定量评估 47 个标准文本相关视觉基准,并利用在线平台提供用户级评估。结果显示,采用多轮推理评估框架可以缓解对象幻觉问题,为开发有效的 LVLM 评估流水线提供了启示。