xView:高空影像中的物体上下文
本文介绍了一个名为 SpaceNet MVOI 的开源数据集,包含了不同视角下 (从 - 32.5 度到 54 度) 的 27 张覆盖面积 665 平方公里地理范围内的图像和 126,747 个建筑物标注,作者基于该数据集对多种先进的分割和目标检测模型在建筑物检测,泛化性和分辨率变化等方面进行了测试,发现当纵向与横向的视觉角度超过 20 度时,即便是最先进的模型也无法正确识别建筑物,这是一个在动态环境下,探测小、异构目标检测方面的重要挑战。
Mar, 2019
该论文介绍了在 DIUx xView 2018 Detection Challenge 中获得第一名的方法,即使用新的卫星图像数据集,通过引入一种新颖的减少焦点损失函数来解决数据集的类别不平衡问题。
Mar, 2019
EAGLE 是一种大规模的数据集,用于航空图像中多类车辆的检测,并包含了各种各样的真实世界情况,由定向边界框定义并注释,支持研究雾霾和阴影去除以及超分辨率和修补应用。
Jul, 2020
提出了一个新的物体检测数据集 V3Det,包含着丰富的边界框和类别层次结构,可以用于 vast 和 open vocabulary 的物体检测任务。
Apr, 2023
本研究提出了一个新的数据集 Objaverse-XL,该数据集包含超过 1000 万个多样化来源的 3D 物体,从手工设计物体到历史文物数字扫描等,旨在帮助 3D 视觉领域得到更大的发展以及在许多方面取得成果
Jul, 2023
使用 You Only Look Twice (YOLT) 管道,通过深度学习技术,在相对较少的训练数据和多个传感器上快速、有效地检测任意尺寸的目标,包括小于 10 个像素。
May, 2018
发布了第一个用于车路协同自动驾驶的真实场景多模态多视角数据集 DAIR-V2X,其中包括 71254 帧 LiDAR 和摄像头帧,是解决车路协同 3D 物体检测问题的一个基准,并提出了延迟融合框架 TCLF。
Apr, 2022
本篇论文介绍了一个名为 VisDrone2018 的大规模视觉对象检测和跟踪基准,目的在于推进基于无人机平台上的视觉理解任务,其包含了 14 个不同城市的各种城市 / 郊区地区的图像和视频序列,并提供了丰富的标注,如物体边界框的位置,物体类别,遮挡,截断比等,是迄今为止发表的最大的数据集之一,可广泛评估并研究在无人机平台上的视觉分析技术。
Apr, 2018
我们介绍了 OpenStreetView-5M,这是一个大规模、开放获取的数据集,包含了超过 510 万个地理参考的街景图像,涵盖了 225 个国家和地区。通过对各种最新图像编码器、空间表示和训练策略进行广泛测试,我们展示了该数据集的实用性,并解决了图像定位在计算机视觉算法中的问题。
Apr, 2024