PACE：杂乱环境下的姿态注释

Dec, 2023

PACE: Pose Annotations in Cluttered Environments

Yang You, Kai Xiong, Zhening Yang, Zhengxiang Huang, Junwei Zhou...

TL;DR在计算机视觉中，姿势估计是一项关键任务，其目的是在图像或视频中跟踪和操作物体。然而，在姿势估计领域，存在缺乏专注于具有遮挡的杂乱场景的大规模数据集的问题。为了解决这个问题，我们引入了 PACE（杂乱环境中的姿势注释），这是一个大规模基准，旨在推动杂乱场景中姿势估计方法的开发和评估。PACE 包括 300 个视频中的 54,945 帧，涵盖了 44 个类别的 576 个物体，并在杂乱场景中包含刚性和关节式物品的混合。为了高效地对真实世界数据进行注释，我们开发了一种使用校准的 3 相机设置的创新注释系统。我们在 PACE 上使用最先进的算法进行了两个方面的测试：姿势估计和物体姿态跟踪，揭示了该基准的挑战和研究机会。我们计划将 PACE 作为公开的评估基准发布，并提供我们开发的注释工具，以促进该领域的进一步发展。我们的代码和数据可在此 https URL 上找到。

Abstract

pose estimation is a crucial task in computer vision, enabling tracking and manipulating objects in images or videos. While several datasets exist for pose estimation, there is a lack of large-scale datasets spec

pose estimation computer vision cluttered scenes occlusions benchmark

发现论文，激发创造

人体姿态估计在现实世界拥挤场景中的应用

本论文针对人群姿态估计的问题，提出了通过数据增强方法、显式识别遮挡的身体部位和使用合成数据集来优化姿态估计。论文的实验结果表明这些方法提高了模型的准确性，使其在人群场景下获得了与当前最先进方法相媲美的结果。

Jul, 2019

PoseTrack: 人体姿态估计和跟踪基准

本研究旨在建立 “PoseTrack” 的标准，该标准是一种基于视频的多人姿势估计和关节跟踪的大规模基准，该基准将集合人类视觉分析研究人员的团体，通过提供大型代表性训练数据集，为研究提供平台并客观评估和比较提出的方法。

Oct, 2017

CrowdPose：高效的拥挤场景姿态估计和新基准

本研究提出一种新颖的、高效的多人姿态估计方法，通过图模型的全局关键点最大化关联和每个关节的多峰预测，实现在拥挤场景下的准确姿态估计和高效推理，并提供新的数据集以更好地评估算法。在 CrowdPose 数据集上，本方法的 mAP 优于最先进的方法 5.2，并在 MSCOCO 数据集上验证了本方法的泛化能力。

Dec, 2018

ClearPose: 大规模透明物体数据集和基准

本研究针对透明物体的属性，提出了一种大规模真实世界 RGB-Depth 透明物体数据集，命名为 ClearPose，用于定量评价分割、场景级深度完成和物体居中姿态估计的任务，该数据集包含超过 350K 个标记的真实世界 RGB-Depth 帧和 5M 个实例注释涵盖 63 种家庭物品等。

Mar, 2022

PAD：一份姿势不可知异常检测的数据集和基准

通过构建包含各种姿势的多姿态异常检测数据集（MAD）和提出专门设计用于姿态无关异常检测的新方法 OmniposeAD，该论文解决了机器视觉领域中物体异常检测中的两个重要挑战，并提供了开放源代码基准库以促进未来在该领域的研究和应用。

Oct, 2023

MoCap 引导的数据增强在野外三维姿态估计中的应用

该论文提出了一种采用基于图像合成方法生成真实图片数据集以训练 CNN 模型，用于解决 3D 人体姿态估计缺少真实数据的问题，并通过在受控环境和实境的表现表明其可行性。

Jul, 2016

APTv2：大规模数据集及其性能超越的动物姿态估计和追踪评测

动物姿势估计和跟踪（APT）是在一系列视频帧中检测和监测动物关键点的关键任务，是理解动物行为的基础，该研究介绍了 APTv2—— 一个用于动物姿势估计和跟踪的先驱性大规模基准测试集，包含了来自 30 种不同动物物种的 2,749 个经过筛选和收集的视频剪辑，通过手工注释和严格的验证为共 84,611 个动物实例提供了高质量的关键点和跟踪注释。

Dec, 2023

JRDB-Pose: 一个用于多人姿态估计与跟踪的大规模数据集

介绍了 JRDB-Pose 数据集，该数据集是一个使用社交导航机器人拍摄的大规模数据集，并包括拥挤室内外位置和各种尺度和遮挡类型的挑战场景，可用于多人姿态估计和跟踪的基准测试，为自主机器人系统在人类环境中的操作和决策提供深入理解的支持。

Oct, 2022

视频中高效姿态估计的检测与追踪

该论文提出了一种基于最新的人体检测和视频理解技术的轻量化人体关键点估计和跟踪方法，在帧级别和短视频片段中进行关键点估计，并进行轻量级跟踪，领先于多项竞争者，成为 2017 年 ICCV PoseTrack 的关键点跟踪挑战的最佳表现。

Dec, 2017

窥探被遮挡关节：一种新的群体姿势估计框架

研究提出了一种新的基于图像感知的渐进 GCN 模块，用于从推理角度估计不可见关节的姿态估计问题，并且通过提出一种新的带有 9k 个注释图像的 Occluded Pose (OCPose) 数据集的 OPEC-Net 框架来解决在 occlusions 中的定位挑战。

Mar, 2020