AP-10K：野外动物姿态估计基准测试

Aug, 2021

AP-10K：野外动物姿态估计基准测试

AP-10K: A Benchmark for Animal Pose Estimation in the Wild

Hang Yu, Yufei Xu, Jing Zhang, Wei Zhao, Ziyu Guan...

TL;DR本文提出了 AP-10K, 首个大规模哺乳动物动物姿态估计基准，提出了包括监督学习、领域迁移和域泛化在内的三个任务以及相应的姿态估计模型，通过实验结果展示了从多种不同动物物种进行学习在准确性和泛化能力方面的优越性，为未来动物姿态估计的研究开辟了新方向。

Abstract

Accurate animal pose estimation is an essential step towards understanding animal behavior, and can potentially benefit many downstream applications, such as wildlife conservation. Previous works only focus on specific animals while ignoring the diversity of animal species, limiting th

animal pose estimation ap-10k mammal supervised learning domain generalization

发现论文，激发创造

APTv2：大规模数据集及其性能超越的动物姿态估计和追踪评测

动物姿势估计和跟踪（APT）是在一系列视频帧中检测和监测动物关键点的关键任务，是理解动物行为的基础，该研究介绍了 APTv2—— 一个用于动物姿势估计和跟踪的先驱性大规模基准测试集，包含了来自 30 种不同动物物种的 2,749 个经过筛选和收集的视频剪辑，通过手工注释和严格的验证为共 84,611 个动物实例提供了高质量的关键点和跟踪注释。

Dec, 2023

一份新颖的四足动物关键点检测数据集

本文介绍了使用深度学习模型结合 AwA Pose 数据集识别四足动物关键点的研究成果，该数据集涵盖了较多动物种类及关键点数量，可以帮助计算机视觉领域研究构建更准确的模型。

Aug, 2021

Animal3D: 一份全面的 3D 动物姿势和形状数据集

提出了 Animal3D 数据集，为哺乳动物的 3D 姿态和形状估计提供了全面的数据集，实验证明跨物种的动物 3D 形状和姿态的预测仍然是一项非常具有挑战性的任务，合成预训练是提高模型性能的一种可行策略。

Aug, 2023

动物姿势估计的跨域适配

本文介绍了一种利用跨域适配方法和人类姿态数据集提升多种动物物种姿态估计的方法。实验表明，该方法可以很好地利用先验知识，并取得令人信服的结果。

Aug, 2019

超级动物模型：为动物行为分析预训练的即插即用模型

SuperAnimal 是一种新的解决行为分析中 pose 估计问题的 plug-and-play 解决方案，使用深度学习技术自动提取关键点，无需人工标记，并可应用于超过 45 种物种。

Mar, 2022

姿势估计模型在损伤下的鲁棒性基准测试

我们引入了 PoseBench，这是一个全面的基准，旨在评估姿势估计模型在面对真实世界的破坏时的健壮性，通过评估 60 种代表性模型，包括自上而下、自下而上、基于热图、基于回归和基于分类的方法，跨三个用于人类和动物姿势估计的数据集，我们的研究发现顶尖模型在面对常见真实世界破坏时易受攻击，并在应对人类和动物姿势估计任务时表现出不同行为。为了提高模型健壮性，我们深入研究了各种设计考虑因素，包括输入分辨率、预训练数据集、骨干网络容量、后处理和数据增强。我们希望我们的基准可以为推动健壮姿势估计研究提供基础。

Jun, 2024

Pose for Everything: 通往类别无关姿势估计之路

本文提出了一种 CAPEG 框架，即 POSE Matching Network，并提出了一种基于 transformer 的 Keypoint Interaction Module，能够捕捉不同关键点之间的交互和支持和查询图像之间的关系，同时介绍了一个新的 MP-100 数据集，使用实验表明我们的方法比其他基线方法表现更好。

Jul, 2022

野生动物再识别数据集：包含 1 万只个体的野生动物再识别数据集

我们推出了一个新的野生动物重新识别数据集 WildlifeReID-10k，包含超过 214k 张 10k 只个体动物的图像。该数据集由 30 个现有的野生动物重新识别数据集加上额外的处理步骤组成。我们认为，由于数据集中相似图像的普遍存在，标准（随机）的训练集和测试集划分对于野生动物重新识别是不适当的，并提出了一种基于提取特征相似性的新的相似性感知划分。为了促进公平的方法比较，我们针对封闭集和开放集设置都提供相似性感知划分，使用 MegaDescriptor 作为野生动物重新识别的基准模型，同时提供最佳结果的排行榜。我们公开发布数据集以及用于创建它的代码在 wildlife-datasets 库中，使得 WildlifeReID-10k 既高度精选又易于使用。

Jun, 2024

使用野外动态抓取数据对单目三维狗姿态估计进行基准测试

我们介绍了一种针对从野外单眼图像中进行 3D 犬姿势估计的新型基准分析。我们使用了一个多模态数据集 3DDogs-Lab，其中拍摄了不同品种狗在走道上奔跑的情景，并包含了来自光学标记的运动捕捉系统、RGBD 相机、IMU 以及压力垫的数据。为了解决由于光学标记的存在和有限的背景多样性使得所拍摄视频不够真实的问题，我们创建了 3DDogs-Wild，该数据集是对原数据集进行自然处理，消除了光学标记并将被拍摄对象放置在多样的环境中，提高了训练基于 RGB 图像的姿势检测器的效果。我们表明，使用 3DDogs-Wild 进行模型训练可在野外数据上实现更好的性能。此外，我们使用不同的姿势估计模型进行了详细分析，揭示了它们各自的优势和不足。我们相信我们的发现以及提供的数据集将为推进 3D 动物姿势估计提供有价值的见解。

Jun, 2024

UniAP: 透过少样本学习实现通用动物视觉感知

UniAP 是一种新型的通用动物感知模型，它利用少样本学习实现不同视觉任务中不同动物之间的跨物种感知。通过利用不同动物和任务之间的共享视觉特征，UniAP 能够将知识从研究充分的物种传递到有限标记数据甚至从未见过的物种中，展示其在姿势估计、分割和分类任务方面的广泛适应性和泛化能力。

Aug, 2023