Apr, 2024

VideoSAGE: 利用图表示学习进行视频摘要

TL;DR提出了一种基于图的表示学习框架用于视频摘要,通过将输入视频转换为图,从而在图上建立稀疏连接,将视频摘要任务转化为二进制节点分类问题,以捕捉视频帧之间的长程相互作用,同时具有更高的计算效率和内存利用率。