AAAIFeb, 2020

动作识别的知识融合网络

TL;DR本文提出了一种基于知识集成网络(KINet)的视频动作识别框架,该框架利用人体信息和场景上下文的有意义特征,设计了一个三支架构最终能够有效识别动作, 提供了最先进的性能表现, 并且进行了在 UCF-101 上的迁移学习,能够达到 97.8% 的高准确率。