MMMar, 2020

视频动作检测的长短期关系网络

TL;DR本文提出了一种新的长短期关系网络(LSTR),通过空时注意机制建模视频内的短期人类 - 背景关系,并通过级联方式使用图卷积网络(GCN)推理长期时空动态,从而增强视频动作检测的特征表现。在四个基准数据集上进行广泛实验,与现有方法相比,取得了优异的结果。