CVPRSep, 2021

IntentVizor:面向通用查询引导的交互式视频摘要

TL;DR本文介绍 IntentVizor,一种基于多模态查询的交互式视频摘要框架。通过使用我们所提出的一系列意图,我们设计了一个新型交互式视觉分析界面,并使用 GSE-GCN 来提高视频理解的摘要质量。我们针对两个基准数据集进行了实验,并与现有方法进行了比较,验证了该框架的有效性。