关键词multi-stream framework
搜索结果 - 2
- 基于骨架的多流自适应图卷积网络动作识别
本文提出了一种多流注意力增强的自适应图卷积神经网络 (MS-AAGCN),用于基于骨架的动作识别。该模型可以端到端地学习图的拓扑结构,并用空时通道注意模块提高模型注意到重要关节、帧和特征。多流框架同时建模关节和骨骼信息及其运动信息,结果在大 - 融合多路深度网络进行视频分类
本研究提出了一种多流深度网络架构,用于解决视频分类问题。通过训练三种卷积神经网络来建模视频中的空间、短期动态和音频线索,并采用长短期记忆网络来探索长期时间动态,最终通过自适应融合方法生成预测结果,将多模态信息充分利用。实验证明,该方法的性能