Jan, 2015

共正则化的深度表示在视频摘要中的应用

TL;DR本文提出了一种基于卷积神经网络和受限玻尔兹曼机相结合的关键帧摘要框架,使用原始的协同正则化方案发现有意义的主题-场景关联,并利用多模态表示选择高度相关的关键帧,经过对比实验表明,该方法在吸引力和信息量方面始终优于基线方案,特别是对于较小的摘要,其优势更为显著。