BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-turn reasoning evaluation framework
搜索结果 - 1
LVLM-eHub:面向大型视觉语言模型的全面评估基准
本文介绍了一个 LVLM-eHub 综合评估平台,使用 6 种多模态能力定量评估 47 个标准文本相关视觉基准,并利用在线平台提供用户级评估。结果显示,采用多轮推理评估框架可以缓解对象幻觉问题,为开发有效的 LVLM 评估流水线提供了启示。
PDF
a year ago
Prev
Next