MMJul, 2022

OS-MSL: 一阶段多模态序列链接框架用于场景分割和分类

TL;DR本文提出了一种新颖的方式 —— 预测镜头之间的链接,将场景分割和分类这两个任务融合成一个任务,同时引入了一个特定的模块 ——DiffCorrNet 来明确提取镜头间的差异和相关性,通过广泛的实验,证明了这种方式确实有效。