Oct, 2023

视频中复杂活动检测的混合图网络

TL;DR使用混合图神经网络对视频进行复杂活动检测,通过对局部动态场景的图表达应用注意力和对整体长时间活动的时间图表达,提取特征并估计复杂活动类别及其开始和结束时间。在 ActivityNet-1.3、Thumos-14 和 ROAD 三个数据集上,所提出的框架优于所有现有的最先进方法。