xView：高空影像中的物体上下文

Feb, 2018

xView: Objects in Context in Overhead Imagery

Darius Lam, Richard Kuzma, Kevin McGee, Samuel Dooley, Michael Laielli...

TL;DR该论文介绍了一个新的大规模数据集，该数据集可用于促进目标检测技术和高空目标检测研究。该数据集使用了一个新颖的地理空间类别检测和边界框注释过程，包括三个质量控制阶段。xView 是迄今为止最大、最多样化的公开目标检测数据集之一。

Abstract

We introduce a new large-scale dataset for the advancement of object detection techniques and overhead object detection research. This satellite imagery dataset enables research progress pertaining to four key computer vision frontiers. We utilize a novel process for →

object detection satellite imagery dataset computer vision geospatial category detection single shot multibox detector

发现论文，激发创造

SpaceNet MVOI: 多视角遥感图像数据集

本文介绍了一个名为 SpaceNet MVOI 的开源数据集，包含了不同视角下 (从 - 32.5 度到 54 度) 的 27 张覆盖面积 665 平方公里地理范围内的图像和 126,747 个建筑物标注，作者基于该数据集对多种先进的分割和目标检测模型在建筑物检测，泛化性和分辨率变化等方面进行了测试，发现当纵向与横向的视觉角度超过 20 度时，即便是最先进的模型也无法正确识别建筑物，这是一个在动态环境下，探测小、异构目标检测方面的重要挑战。

Mar, 2019

Reduced Focal Loss: xView 卫星图像目标检测第一名解决方案

该论文介绍了在 DIUx xView 2018 Detection Challenge 中获得第一名的方法，即使用新的卫星图像数据集，通过引入一种新颖的减少焦点损失函数来解决数据集的类别不平衡问题。

Mar, 2019

使用航空影像技术进行真实世界场景下的大规模汽车检测数据集 EAGLE

EAGLE 是一种大规模的数据集，用于航空图像中多类车辆的检测，并包含了各种各样的真实世界情况，由定向边界框定义并注释，支持研究雾霾和阴影去除以及超分辨率和修补应用。

Jul, 2020

V3Det：大规模词汇视觉检测数据集

提出了一个新的物体检测数据集 V3Det，包含着丰富的边界框和类别层次结构，可以用于 vast 和 open vocabulary 的物体检测任务。

Apr, 2023

Objaverse-XL: 一个拥有超过 1000 万个三维物体的宇宙

本研究提出了一个新的数据集 Objaverse-XL，该数据集包含超过 1000 万个多样化来源的 3D 物体，从手工设计物体到历史文物数字扫描等，旨在帮助 3D 视觉领域得到更大的发展以及在许多方面取得成果

Jul, 2023

快速多尺度卫星图像物体检测：你只需要看两次

使用 You Only Look Twice (YOLT) 管道，通过深度学习技术，在相对较少的训练数据和多个传感器上快速、有效地检测任意尺寸的目标，包括小于 10 个像素。

May, 2018

DAIR-V2X: 用于车路协作三维物体检测的大规模数据集

发布了第一个用于车路协同自动驾驶的真实场景多模态多视角数据集 DAIR-V2X，其中包括 71254 帧 LiDAR 和摄像头帧，是解决车路协同 3D 物体检测问题的一个基准，并提出了延迟融合框架 TCLF。

Apr, 2022

DOTA：大规模航空图像目标检测数据集

本文介绍了一个大规模的遥感图像数据集 DOTA，该数据集为地球观测和遥感领域中的目标检测提供了基础，并提出了一种基准模型和评测方法。

Nov, 2017

视觉与无人机：一项挑战

本篇论文介绍了一个名为 VisDrone2018 的大规模视觉对象检测和跟踪基准，目的在于推进基于无人机平台上的视觉理解任务，其包含了 14 个不同城市的各种城市 / 郊区地区的图像和视频序列，并提供了丰富的标注，如物体边界框的位置，物体类别，遮挡，截断比等，是迄今为止发表的最大的数据集之一，可广泛评估并研究在无人机平台上的视觉分析技术。

Apr, 2018

OpenStreetView-5M：全球可视化地理定位之多种路径

我们介绍了 OpenStreetView-5M，这是一个大规模、开放获取的数据集，包含了超过 510 万个地理参考的街景图像，涵盖了 225 个国家和地区。通过对各种最新图像编码器、空间表示和训练策略进行广泛测试，我们展示了该数据集的实用性，并解决了图像定位在计算机视觉算法中的问题。

Apr, 2024