关键词human activity understanding
搜索结果 - 7
- 时间对齐 2D 骨架序列学习
本论文提出了一种自监督学习的视频对齐框架,利用 2D 骨架热图作为输入,通过自身在空间和时间域内的自注意力机制来提取有效的时空和上下文特征,同时通过基于 2D 骨架的热图增强技术进行自监督学习,取得了比 CASA 更高的准确度和对缺失和噪声 - HAKE: 人类活动理解的知识引擎基础
该论文提出了一种新的方法来解决人类活动理解中的图像识别问题,该方法包括将像素映射到原子活动原始空间内,然后利用可解释的逻辑规则进行语义推理。该方法获得了很大的改进和成功,并且在当前研究领域有着广泛的应用。
- ECCV在视频中联合学习社交群体、个体动作和子群体活动
本文提出了一个端到端的可训练框架来解决人类活动理解中的社交任务。该框架同时分组人们,预测他们的个人行为和每个社交团体的社交活动,并提供了新的数据集注释。
- HAKE: 人类活动知识引擎
通过人体部位状态建立大规模的人体活动知识引擎(HAKE),提出了基于 HAKE 的部位状态识别模型,并且证明了这种方法能够提高模型在人 - 物互动识别和一次性子集上的表现。
- ICCV如何理解视频中的人类行为所需的行动?
这篇论文分析了当前视频中人类活动理解的研究现状和未来方向,探讨了数据集,评估指标,算法和未来发展方向,并提出需要掌握的信息以实现活动理解的重大进展。
- MM可重构卷积神经网络实现的三维人体活动识别
本文提出了一种基于 RGB-D 视频的自动活动识别的深度模型,使用 3D 卷积和最大池化算子,结合激活函数以及学习出活动的时间结构,该模型可以直接作用在原始输入上进行活动分类,而且还允许动态调整模型结构以适应人类活动的时间变化,并在挑战性场 - CVPR利用文本预测行动动机
本文介绍了在计算机视觉中应用自然语言模型,从大量文本中获取知识;通过将该知识转移到视觉任务中,可以帮助计算机视觉系统理解人们在图像中执行操作的动机,尽管完全理解动机仍然有很长的路要走。