关联嵌入:联合检测和分组的端到端学习
本文提出了一种用于学习将身体相似姿势的图像放置在附近的embedding方法,该方法可以作为一种直接比较基于人体姿势的图像的方法,避免了估计身体关节位置的潜在挑战。通过三元组距离准则构建了姿态嵌入学习,采用深度架构,使能够学习区分不同姿态的表征,文中的实验在人体姿态匹配和从视频数据中检索上展示了该方法的潜力。
Jul, 2015
本文探讨了深度学习方法在物体识别和姿态估计方面的应用,发现卷积神经网络(CNN)可以同时进行物体分类和姿态估计,并在两个大型多视点数据集上实现了优于最先进方法的表现。
Nov, 2015
本研究提出了一种联合解决检测和姿态估计任务的方法,并使用基于CNN部件检测器生成的一组身体部位假设的分区和标签化公式,隐含执行非最大化抑制,以形成符合几何和外观约束的身体部件配置,对于单人和多人姿态估计都取得了最新的结果。
Nov, 2015
本文提出了一种基于整数线性规划的方法来解决多人姿态估计的问题,并且在 MPII 人体多人姿态数据集上实现了与最先进方法相当的精度,但速度快了 6,000 到 19,000 倍。
Aug, 2016
本文提出了一种针对无限约束视频中多人的关节追踪方法,利用简化稀疏的身体关系图和最近的快速推断方法,以及将计算量转移到卷积结构上;并将关节定位方案用于构建关节追踪形式,解决了所有场景中的关联问题,并已在公共MPII Human Pose基准测试中取得最新结果。
Dec, 2016
提出一种基于部件建模的无框架底层算法,将姿态估计和多人图像实例分割任务结合起来,使用卷积神经网络检测关键点并预测其相对位移,允许将关键点分组为个人姿势实例,并提出一种部分诱导的几何嵌入描述符。此系统基于完全卷积架构,具有高效的推理能力,在 COCO 数据集上进行训练,实现了显着的性能优化,是首个在 COCO 实例分割任务中策略人类一类的结果。
Mar, 2018
本文提出了一个统一的框架,用于实现多人姿态估计和跟踪,包含两个主要组件 SpatialNet 和TemporalNet,其中 SpatialNet 在单帧中实现了身体部位检测和部位级别的数据关联,而TemporalNet 则将连续帧中的人类实例分组为轨迹。
Mar, 2019
本研究介绍了CenterGroup,这是一种基于注意力机制的框架,用于从一组身份不可知的关键点和人物中心预测中估计人体姿势。我们的方法使用transformer为所有检测到的关键点和中心获取上下文感知嵌入,然后应用多头注意力直接将关节分组到相应的人物中心。最终,我们的方法在实现最先进性能的同时,比竞争的从底部方法提高了多达2.5倍的推理速度。
Oct, 2021
本文提出了一种有效的点到框回归器 Group R-CNN 用于弱监督目标检测问题,在 MS-COCO 基准测试上实验表明,Group R-CNN 显著优于 Point DETR 等方法,可用于小批量标注数据集的物体检测。
May, 2022
通过简单且有效的Transformer方法,命名为Group Pose,我们研究了无人工盒监督的端到端多人姿态估计问题,取得了优于复杂解码器的性能。
Aug, 2023