增强型通道与空间信息的多人姿态估计
提出了一种上下文感知路径和空间感知路径相结合的 Context-and-Spatial Aware Network (CSANet),通过结构监督和空间金字塔池化策略增强上下文信息,保留空间信息,加强特征,并在 COCO 关键点基准测试中,优于现有的最先进方法。
May, 2019
本文提出了一种基于多视图图像的多人姿态估计方法,在统计参数体模型的引导下,这种方法能够更好地纠正不合理的 3D 姿态估计和填充缺失的关节点检测,将 2D 和 3D 观测联系起来,从而更准确地估计 3D 姿态并且具有较好的泛化性能,实验表明该方法的效果优于现有的方法。
Oct, 2021
本文提出了一种名为 MSA R-CNN 的多尺度聚合方法,该方法通过多尺度 ROIAlign 块和多尺度关键点头网络来利用多尺度信息,并将人体检测和关键点定位合并到一个模型中,从而实现了较小的计算量,该方法在 2D 多人关键点本地化数据集上表现最佳。
May, 2019
通过通道和空间特征调制,本文提出了一种利用序列化特征调制存储器单元及密集连接结构将低分辨率特征转换为高信息特征的网络,该网络能够加强高贡献信息和抑制冗余信息,同时通过门控融合节点适应性地融合分层特征,使得模型在图像超分辨率上比现有技术更优秀。
Sep, 2018
提出了 Single-stage multi-person Pose Machine (SPM)模型,以简化多人姿势估计过程,并通过结构化姿势表示法(SPR)直接预测多人姿势,同时还扩展了 SPR 以进行层次化表示和应用于多人 3D 姿势估计,实验表明 SPM 模型相比现有方法具有更高的效率和精度。
Aug, 2019
使用 2.5D 表示法并通过深度感知的算法进行部分关联,实现了单视图下从 RGB 图像中恢复出多人具有绝对尺度的 3D 姿态,该方法在 CMU Panoptic 和 MuPoTS-3D 数据集上达到了最新的技术水平,适用于野外视频。
Aug, 2020
本文提出了一种多尺度结构感知神经网络,通过多尺度监督、多尺度回归网络、中间监督和结构感知损失以及关键点掩蔽训练方案等四个方面对深度卷积 - 反卷积沙漏模型进行改进,以有效地提高人体姿势估计的性能。该网络不仅可以解决尺度差异、遮挡和复杂多人场景等问题,而且可以全局优化多尺度特征的结构匹配,并在 MPII 挑战排行榜上取得了领先地位。
Mar, 2018
本文提出了一种新型的高效多尺度注意力(EMA)模块,通过重新调整通道信息,并将通道分组到多个子特征中,实现对空间语义特征的良好分布,在图像分类和目标检测任务中取得了显著性能。
May, 2023
研究单阶段方法与多阶段方法在姿态估计领域的性能表现,提出了单阶段模块设计、跨阶段特征聚合和粗到细的监督等改进建议,所得方法在 MS COCO 和 MPII Human Pose 数据集上都取得了新的最优表现,证明了多阶段架构的有效性。
Jan, 2019
本文介绍了一种多人 3D 姿态估计的快速、鲁棒方法,使用多方式匹配算法来解决在噪声和不完整的 2D 姿态预测中查找跨视角对应关系的主要挑战,并结合几何和外观提示进行跨视角匹配。
Jan, 2019