AAAIJan, 2020

卷积分层注意网络用于查询焦点视频摘要

TL;DR本文提出了一种基于查询的视频摘要生成方法,通过计算视频镜头与查询之间的相似度,采用包含两个部分的 Convolutional Hierarchical Attention Network 实现了对视觉信息的编码和查询相关性的计算,得到了查询相关的视频摘要。