Nov, 2023

Video-Bench:用于评估基于视频的大型语言模型的综合基准和工具包

TL;DR视频型大型语言模型(Video-LLM)的评估系统是本文提出的主题,通过建立全面的基准测试系统,评估多种任务下的 Video-LLM 能力水平,揭示当前模型在理解和分析真实世界视频方面与人类的差距,提供有价值的研究方向。