Apr, 2023

MRSN: 多关系支持网络的视频动作检测

TL;DR该研究提出了一种名为 MRSN 的神经网络模型,利用 Actor-Context 和 Actor-Actor Relation Encoder 分别建模,并通过 Relation Support Encoder 计算二者的支持并进行关系级互动,最终通过 Relation Consensus Module 将这两个关系与长期关系相融合,成功地解决了动作检测这一具有挑战性的视频理解任务。