Sep, 2023

规模化的视频章节 (VidChapters-7M)

TL;DR视频章节生成、时间分割、章节标题生成、视频章节定位和在 VidChapters-7M 上的预训练能够显著改进 YouCook2 和 ViTT 基准测试中的视频语言模型绩效。