Mar, 2024

TempCompass:视频 LLMs 是否真正理解视频?

TL;DR介绍了 TempCompass 基准测试,该基准测试引入了多样化的时间感知和任务格式,全面评估了 8 种最新的视频大语言模型以及 3 种图像大语言模型,并揭示了这些模型在时间感知方面表现出明显的不足。