BriefGPT.xyz
Ask
alpha
关键词
long-form video question-answering
搜索结果 - 1
CVPR
通过剧本进行零样本长片视频理解
MM-Screenplayer 是一种先进的视频理解系统,具备多模态感知能力,可以将任何视频转换为文本剧本表示形式。与以往的故事叙述方法不同,我们将视频内容以场景为基本单位进行组织,而不仅仅是视觉连续的镜头。此外,我们开发了一种 “回溯”
→
PDF
11 days ago
Prev
Next