Nov, 2023

野生动物数据集:一个用于动物再识别的开源工具包

TL;DR该研究论文介绍了 WildlifeDatasets 工具集,一个开源工具集用于生态学家和计算机视觉 / 机器学习研究人员,它使用 Python 编写,提供了简单直接获取公开的野生动物数据集的方法,并提供了各种数据集预处理、性能分析和模型优化方法。我们在不同的场景和基准实验中展示了该工具集,包括了野生动物再识别数据集和方法的最全面比较,包括了局部描述符和深度学习方法。此外,我们提供了首个针对各种动物个体再识别的基础模型 - MegaDescriptor,该模型在动物再识别数据集上表现优异,超过了 CLIP 和 DINOv2 等预训练模型的性能。为了让该模型对大众可用以及方便集成到任何现有的野生动物监测应用中,我们通过 HuggingFace hub 提供了多个 MegaDescriptor 版本(即 Small、Medium 和 Large)。