神经互动关键点检测

ICCVAug, 2023

Neural Interactive Keypoint Detection

Jie Yang, Ailing Zeng, Feng Li, Shilong Liu, Ruimao Zhang...

TL;DR该研究提出了一种名为 Click-Pose 的端到端神经交互式关键点检测框架，相比于仅使用手动标注，能够大大降低 2D 关键点注释的标注成本，并探索用户反馈如何与神经关键点检测器合作，在交互方式下更快、更有效地修正预测的关键点。

Abstract

This work proposes an end-to-end neural interactive keypoint detection framework named click-pose, which can significantly reduce more than 10 times labeling costs of 2D keypoint →

end-to-end neural interactive keypoint detection click-pose annotation pose error modeling human-feedback loop

发现论文，激发创造

基于人体关键点的视角估计引导方法

提出 Click-Here CNN 以整合语义目标关键点信息加权影响图像特征，结合全局图像特征提高模型准确率，实验结果在 PASCAL 3D + 数据集上表现出优异性能。

Mar, 2017

关键点社群

用快速的自下而上的方法，结合图形中心性度量对人类或物体上的 100 多个关键点进行检测，为硬件和人物建模，量化关键点的独立性，将训练权重分配给不同部位的姿势。经实验证明该方法优于以往的所有人体姿势估计方法，而且具有很好的泛化性能。

Oct, 2021

DirectPose：直接端到端的多人姿势估计

提出了第一个直接的端到端多人姿态估计框架，称为 DirectPose，使用新的关键点对齐机制 (KPAlign)，该机制提高了准确性，并消除了需在底部向上方法中处理的启发式分组或在自顶向下方法中进行边界框检测和 RoI 操作。实验证明，这一端到端模式在人体姿态估计任务中可以达到与之前强大基线相媲美或更好的表现。

Nov, 2019

大规模多人姿态估计的精度提升

该论文提出了一种用于多人检测和二维姿势估计的方法，采用两个阶段的简单而强大的自上而下方法，结合使用 Faster RCNN 检测器、关键点基于非最大抑制（Non-Maximum-Suppression）和置信度计算，利用 COCO 数据集训练得到的该系统具有较高的平均精度和表现。

Jan, 2017

视频中高效姿态估计的检测与追踪

该论文提出了一种基于最新的人体检测和视频理解技术的轻量化人体关键点估计和跟踪方法，在帧级别和短视频片段中进行关键点估计，并进行轻量级跟踪，领先于多项竞争者，成为 2017 年 ICCV PoseTrack 的关键点跟踪挑战的最佳表现。

Dec, 2017

关键点预测下的目标姿态自监督学习

本文提出了一种基于自监督学习的关键点预测方法来进行相机位姿预测及三维目标物体的在线重建的深度学习网络，并在几个数据集上进行了实验，取得了显著的改进。

Feb, 2023

YOLO-Pose: 使用物体关键点相似性损失增强 YOLO 进行多人姿态估计

提出了 YOLO-pose 模型，它是一种不需要热力图的多人关键点检测和 2D 姿势估计方法。与现有的基于热力图的两阶段方法相比，该模型可以进行端到端的训练，并优化 Object Keypoint Similarity 指标。该模型在 COCO 测试集上取得了 90.3% 的 AP50 成果，不需要翻转测试、多尺度测试或任何其他测试时间增强。

Apr, 2022

HintPose

本研究通过引入两个新的概念 - instance cue 和 recurrent refinement 到已有的姿态估计模型中，以处理带有多个人的检测框，实现了更准确的姿态估计，并在 COCO17 关键点数据集上取得了较高的 mAP 得分。

Mar, 2020

通过端到端几何推理发现潜在的三维关键点

本文提出了 KeypointNet，这是一个端到端的几何推理框架，用于学习一组最优的类别特定 3D 关键点及其检测器。通过对一张单独图片，KeypointNet 提取出用于下游任务优化的 3D 关键点，我们在 3D 姿势估计方面展示了这种框架，并提出了一个可微的目标，以寻求在两个对象视图之间恢复相对姿态的最佳关键点集。我们的模型在对象类别的不同视角和实例之间发现了几何和语义一致的关键点，重要的是，我们发现我们的端到端框架在不使用地面真值关键点注释的情况下胜过使用相同神经网络架构的完全监督基线在姿势估计任务上，在 ShapeNet 的汽车，椅子和飞机类别上可视化出发现的 3D 关键点。

Jul, 2018

MetaPose: 无需 3D 监督，快速从多视图中获得 3D 姿态

本文介绍如何使用神经网络模型进行多摄像头人体姿势估计，在考虑多角度遮挡及联合位置不确定性情况下，使用 2D 关键点数据进行训练。相比于经典捆绑调整与弱监督单目 3D 基线方法，我们的模型在 Human3.6M 和 Ski-Pose PTZ 数据集上表现更好。

Aug, 2021