AP-10K:野外动物姿态估计基准测试
动物姿势估计和跟踪(APT)是在一系列视频帧中检测和监测动物关键点的关键任务,是理解动物行为的基础,该研究介绍了 APTv2—— 一个用于动物姿势估计和跟踪的先驱性大规模基准测试集,包含了来自 30 种不同动物物种的 2,749 个经过筛选和收集的视频剪辑,通过手工注释和严格的验证为共 84,611 个动物实例提供了高质量的关键点和跟踪注释。
Dec, 2023
本文介绍了使用深度学习模型结合 AwA Pose 数据集识别四足动物关键点的研究成果,该数据集涵盖了较多动物种类及关键点数量,可以帮助计算机视觉领域研究构建更准确的模型。
Aug, 2021
提出了 Animal3D 数据集,为哺乳动物的 3D 姿态和形状估计提供了全面的数据集,实验证明跨物种的动物 3D 形状和姿态的预测仍然是一项非常具有挑战性的任务,合成预训练是提高模型性能的一种可行策略。
Aug, 2023
SuperAnimal 是一种新的解决行为分析中 pose 估计问题的 plug-and-play 解决方案,使用深度学习技术自动提取关键点,无需人工标记,并可应用于超过 45 种物种。
Mar, 2022
我们引入了 PoseBench,这是一个全面的基准,旨在评估姿势估计模型在面对真实世界的破坏时的健壮性,通过评估 60 种代表性模型,包括自上而下、自下而上、基于热图、基于回归和基于分类的方法,跨三个用于人类和动物姿势估计的数据集,我们的研究发现顶尖模型在面对常见真实世界破坏时易受攻击,并在应对人类和动物姿势估计任务时表现出不同行为。为了提高模型健壮性,我们深入研究了各种设计考虑因素,包括输入分辨率、预训练数据集、骨干网络容量、后处理和数据增强。我们希望我们的基准可以为推动健壮姿势估计研究提供基础。
Jun, 2024
本文提出了一种 CAPEG 框架,即 POSE Matching Network,并提出了一种基于 transformer 的 Keypoint Interaction Module,能够捕捉不同关键点之间的交互和支持和查询图像之间的关系,同时介绍了一个新的 MP-100 数据集,使用实验表明我们的方法比其他基线方法表现更好。
Jul, 2022
我们推出了一个新的野生动物重新识别数据集 WildlifeReID-10k,包含超过 214k 张 10k 只个体动物的图像。该数据集由 30 个现有的野生动物重新识别数据集加上额外的处理步骤组成。我们认为,由于数据集中相似图像的普遍存在,标准(随机)的训练集和测试集划分对于野生动物重新识别是不适当的,并提出了一种基于提取特征相似性的新的相似性感知划分。为了促进公平的方法比较,我们针对封闭集和开放集设置都提供相似性感知划分,使用 MegaDescriptor 作为野生动物重新识别的基准模型,同时提供最佳结果的排行榜。我们公开发布数据集以及用于创建它的代码在 wildlife-datasets 库中,使得 WildlifeReID-10k 既高度精选又易于使用。
Jun, 2024
我们介绍了一种针对从野外单眼图像中进行 3D 犬姿势估计的新型基准分析。我们使用了一个多模态数据集 3DDogs-Lab,其中拍摄了不同品种狗在走道上奔跑的情景,并包含了来自光学标记的运动捕捉系统、RGBD 相机、IMU 以及压力垫的数据。为了解决由于光学标记的存在和有限的背景多样性使得所拍摄视频不够真实的问题,我们创建了 3DDogs-Wild,该数据集是对原数据集进行自然处理,消除了光学标记并将被拍摄对象放置在多样的环境中,提高了训练基于 RGB 图像的姿势检测器的效果。我们表明,使用 3DDogs-Wild 进行模型训练可在野外数据上实现更好的性能。此外,我们使用不同的姿势估计模型进行了详细分析,揭示了它们各自的优势和不足。我们相信我们的发现以及提供的数据集将为推进 3D 动物姿势估计提供有价值的见解。
Jun, 2024
UniAP 是一种新型的通用动物感知模型,它利用少样本学习实现不同视觉任务中不同动物之间的跨物种感知。通过利用不同动物和任务之间的共享视觉特征,UniAP 能够将知识从研究充分的物种传递到有限标记数据甚至从未见过的物种中,展示其在姿势估计、分割和分类任务方面的广泛适应性和泛化能力。
Aug, 2023