May, 2014

Microsoft COCO:上下文中的通用物体

TL;DR本研究旨在推进目标识别的最新进展,提出了一种数据集的形式,通过将目标识别的问题置于场景理解的更广泛背景下,聚集了包含常见物品的复杂日常场景的图像,并利用每个实例分割对物品进行标记以协助精确定位,该数据集包含 91 种 4 岁儿童容易识别的对象类型,有 328k 张图像和 250 万个标记实例。本文最终提供了一种基于可变形零件模型的边界框和分割检测结果的基线性能分析。