Sep, 2024

OmniBench:迈向通用全语言模型的未来

TL;DR本研究针对多模态大型语言模型在同时处理和推理多种模态能力不足的问题,提出了一个新基准OmniBench。该基准通过高质量的人类注释,评估模型在视觉、音频和文本输入上的识别、理解和推理能力,发现很多全语言模型在三模态上下文中的指令遵循和推理能力存在显著限制,推动未来研究加强三模态集成技术和训练策略的开发。