Jul, 2021

CLIP-It!基于语言指导的视频摘要

TL;DRCLIP-It 是一种单一框架用于通用和基于查询的视频摘要,使用语言指导的多模式变压器来学习评分视频中的帧,并可以扩展到无监督环境。 在标准的视频摘要数据集和基于查询的视频摘要数据集上均表现出显著的优异性能。