Feb, 2024

Momentor:利用细粒度时间推理推进视频大型语言模型

TL;DR提出了 Momentor,一种能够完成细粒度时态理解任务的 Video-LLM,并通过 Moment-10M 数据集的训练,使其在细粒度理解和定位方面表现出色。