CVPRApr, 2020

一种多模态电影场景分割的从局部到全局的方法

TL;DR为了对电影进行语义理解,提出了一种局部到全局的场景分割框架,其中包含来自三个级别的多模态信息。通过预先训练 MovieScenes 数据集,该框架能够从长片的分层时间结构中提取复杂语义,提供自上而下的场景分割指导,并在实验中取得了高精度的场景分割表现。