Oct, 2024

TemporalBench:多模态视频模型的细粒度时间理解基准

TL;DR本研究针对现有视频基准在细粒度时间理解评估方面的不足,提出了TemporalBench这一新基准。通过约10,000对视频问答对,TemporalBench提供了独特的评估平台,揭示了当前先进模型在时间理解方面与人类之间存在显著差距(约30%)。该基准有助于推动模型在时间推理能力上的改进。