Aug, 2020

一个基于主体中心镜头的镜头类型分类统一框架

TL;DR通过分离主体和背景,并分别对比它们的规模和运动类型,我们提出了Subject Guidance Network(SGNet)的学习框架,以识别视频镜头的类型。我们构建了一个庞大的数据集MovieShots,其中包含7K个电影预告片的46K个视角,用于促进镜头类型的分析和模型评估。实验证明,我们的方法能够准确地识别镜头的规模和运动类型,并胜过所有先前的方法。