用于人与人交互识别的层次化长短时并发记忆
L2STM 是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法,结合多模态训练程序,在人类动作识别方面表现优于现有的基于 LSTM 和 / 或 CNN 的方法。
Aug, 2017
本研究提出了一种基于深度学习的新方法,用于解决从第一人称视角识别互动的问题,其通过一对卷积神经网络提取视频连续帧的特征,然后使用卷积长短时记忆将这些特征进行聚合,最后采用分类算法对记录下的镜头进行分类识别。
Sep, 2017
通过 LSTM 模型构建 2 阶段深层次模型,从而更好地理解群体活动,利用这些动态实现群体活动识别,实验结果表明,该模型可以有效提高群体活动识别性能。
Nov, 2015
本文提出了一种新颖的孪生 LSTM 结构,可以顺序地处理图像区域,并通过利用上下文信息增强局部特征表示的区分能力,有效地解决了多个摄像头视图下的行人匹配问题,取得了与最先进方法相媲美的良好效果,为视觉监控领域的研究提供了新思路。
Jul, 2016
本文针对视频序列中的团体活动行为分类问题,基于 LSTM 模型构建了一个 2 阶段的深度时间模型,同时考虑了个体和群体层面的动态信息,通过在排球视频数据集上的实验验证了该模型的有效性。
Jul, 2016
本文主要介绍了基于卷积神经网络和 LSTM 神经网络的动作识别方法,实验证明本文提出的多流融合模型可以有效地提高识别准确率。
Apr, 2017
本研究提出一种动态局部化长短期记忆(LSTM)模型,通过使用局部动态空间权重矩阵和其动态变化,考虑时间和空间上的复杂动态相互作用,对道路之间的时空关系进行建模,能够处理具有长时序依赖和复杂非线性特征的序列数据,并在实验证明了该模型相比基线方法具有更好的预测性能。
Dec, 2021
自动驾驶或自主移动机器人领域中,预测拥挤场景中行人的轨迹是不可或缺的,因为估计周围行人的未来位置有助于制定政策决策以避免碰撞。本文介绍了一种基于 correntropy 的新机制,不仅可以衡量人与人之间交互的相对重要性,还可以为每个行人建立个人空间。我们进一步提出了一种包含这种数据驱动机制的相互作用模块,可以有效地提取场景中动态人与人之间交互的特征表示,并计算相应的权重来表示不同交互的重要性。为了在行人之间共享这些社交信息,我们设计了一种基于 Long Short-Term Memory(LSTM)网络的相互作用感知架构来进行轨迹预测。我们在两个公共数据集上展示了我们模型的性能,实验结果表明我们的模型可以达到比几种最新方法更好的性能。
Nov, 2023