神经互动关键点检测
提出 Click-Here CNN 以整合语义目标关键点信息加权影响图像特征,结合全局图像特征提高模型准确率,实验结果在 PASCAL 3D + 数据集上表现出优异性能。
Mar, 2017
用快速的自下而上的方法,结合图形中心性度量对人类或物体上的 100 多个关键点进行检测,为硬件和人物建模,量化关键点的独立性,将训练权重分配给不同部位的姿势。经实验证明该方法优于以往的所有人体姿势估计方法,而且具有很好的泛化性能。
Oct, 2021
提出了第一个直接的端到端多人姿态估计框架,称为 DirectPose,使用新的关键点对齐机制 (KPAlign),该机制提高了准确性,并消除了需在底部向上方法中处理的启发式分组或在自顶向下方法中进行边界框检测和 RoI 操作。实验证明,这一端到端模式在人体姿态估计任务中可以达到与之前强大基线相媲美或更好的表现。
Nov, 2019
该论文提出了一种用于多人检测和二维姿势估计的方法,采用两个阶段的简单而强大的自上而下方法,结合使用 Faster RCNN 检测器、关键点基于非最大抑制(Non-Maximum-Suppression)和置信度计算,利用 COCO 数据集训练得到的该系统具有较高的平均精度和表现。
Jan, 2017
该论文提出了一种基于最新的人体检测和视频理解技术的轻量化人体关键点估计和跟踪方法,在帧级别和短视频片段中进行关键点估计,并进行轻量级跟踪,领先于多项竞争者,成为 2017 年 ICCV PoseTrack 的关键点跟踪挑战的最佳表现。
Dec, 2017
提出了 YOLO-pose 模型,它是一种不需要热力图的多人关键点检测和 2D 姿势估计方法。与现有的基于热力图的两阶段方法相比,该模型可以进行端到端的训练,并优化 Object Keypoint Similarity 指标。该模型在 COCO 测试集上取得了 90.3% 的 AP50 成果,不需要翻转测试、多尺度测试或任何其他测试时间增强。
Apr, 2022
本研究通过引入两个新的概念 - instance cue 和 recurrent refinement 到已有的姿态估计模型中,以处理带有多个人的检测框,实现了更准确的姿态估计,并在 COCO17 关键点数据集上取得了较高的 mAP 得分。
Mar, 2020
本文提出了 KeypointNet,这是一个端到端的几何推理框架,用于学习一组最优的类别特定 3D 关键点及其检测器。 通过对一张单独图片,KeypointNet 提取出用于下游任务优化的 3D 关键点,我们在 3D 姿势估计方面展示了这种框架,并提出了一个可微的目标,以寻求在两个对象视图之间恢复相对姿态的最佳关键点集。我们的模型在对象类别的不同视角和实例之间发现了几何和语义一致的关键点,重要的是,我们发现我们的端到端框架在不使用地面真值关键点注释的情况下胜过使用相同神经网络架构的完全监督基线在姿势估计任务上,在 ShapeNet 的汽车,椅子和飞机类别上可视化出发现的 3D 关键点。
Jul, 2018
本文介绍如何使用神经网络模型进行多摄像头人体姿势估计,在考虑多角度遮挡及联合位置不确定性情况下,使用 2D 关键点数据进行训练。相比于经典捆绑调整与弱监督单目 3D 基线方法,我们的模型在 Human3.6M 和 Ski-Pose PTZ 数据集上表现更好。
Aug, 2021