达标游戏

ICCVSep, 2017

Playing for Benchmarks

Stephan R. Richter, Zeeshan Hayder, Vladlen Koltun

TL;DR该研究提出了一个基于虚拟世界的视觉感知基准测试套件，通过对超过 250,000 个高分辨率视频帧的低层次和高层次的视觉任务进行全面地注释，并针对多个任务分析了最先进方法的表现，提供参考基线和突出未来研究的挑战。

Abstract

We present a benchmark suite for visual perception. The benchmark is based on more than 250K high-resolution video frames, all annotated with ground-truth data for both low-level and high-level vision tasks, incl

visual perception benchmark suite ground-truth data virtual world performance analysis

发现论文，激发创造

单目视觉里程计光度校准基准

提出了一个包含 50 个具有独特多样性的现实中场景的数据集，用于评估单目视觉里程计和 SLAM 方法的跟踪精度，并在此基础上提出了一个相机光度校准的简单方法以及一种非参数化暗角校准方法，该研究详细评估了两种现有方法（ORB-SLAM 和 DSO）在该数据集上的效果。

Jul, 2016

用于视觉人群分析的光流数据集和基准

介绍了一种新的光流数据集，用于解决人群行为分析领域中光流性能测试数据不足的问题，并提供了实验结果表明现有的光流算法不能有效地适应这种人群的运动及复杂性，该数据集在实际应用中表现出较高的性能。

Nov, 2018

VBR：罗马视觉基准测试

本文介绍了一份在罗马收集的视觉和感知研究数据集，包括 RGB 数据、3D 点云、IMU 和 GPS 数据，并引入了一个新的基准用于视觉里程计和 SLAM，以推进自主机器人和计算机视觉的研究。

Apr, 2024

视觉与无人机：一项挑战

本篇论文介绍了一个名为 VisDrone2018 的大规模视觉对象检测和跟踪基准，目的在于推进基于无人机平台上的视觉理解任务，其包含了 14 个不同城市的各种城市 / 郊区地区的图像和视频序列，并提供了丰富的标注，如物体边界框的位置，物体类别，遮挡，截断比等，是迄今为止发表的最大的数据集之一，可广泛评估并研究在无人机平台上的视觉分析技术。

Apr, 2018

感知测试：多模式视频模型的诊断基准

本研究提出了一种新颖的多模式视频基准 ——“感知测试”，以评估预训练的多模态模型（如 Flamingo、BEiT-3 或 GPT-4）的感知和推理能力，并针对记忆、抽象、物理、语义等技能和描述性、解释性、预测性、反事实等类型的推理跨越视频、音频和文本模式，提供了一种全面高效的评估工具，以探究预训练模型的迁移能力。

May, 2023

OPV2V: 一个用于车辆间通信感知的开放数据集和融合管道

本文提出了第一个大规模的开放式模拟数据集，其中包含超过 70 个有趣的场景，11464 帧和 232913 标注的三维车辆边界框，以及一个用于评估多种信息融合策略的综合基准测试。同时，作者还提议了一种新的注意力中间融合管道，以聚合来自多个连接车辆的信息，证明该管道即使在大压缩率下也能实现优秀的性能。

Sep, 2021

野外平面物体跟踪：一个基准

本文针对平面目标跟踪问题，设计了一个包含两百多个视频和 eleven 种最先进算法的基准测试，并提供了基准测试的两种评估指标和详细分析结果，旨在促进未来关于平面目标跟踪的研究。

Mar, 2017

WildScenes：大规模自然环境下的二维和三维语义分割基准

近期在语义场景理解方面的进展主要得益于城市环境中具有语义注释的双模态（相机和激光雷达）数据集的可用性。然而，为了实现自然、非结构化环境下的语义感知应用，包括自然保护、搜救、环境监测和农业自动化，我们也需要具有语义注释的数据集。因此，我们介绍了 WildScenes，一个双模态基准数据集，其中包括自然环境下多个大规模遍历，包括高分辨率 2D 图像和密集 3D 激光雷达点云的语义注释，以及准确的 6 自由度姿态信息。我们的 3D 语义标签通过一种高效的自动化过程得到，该过程将多视角中的人工标注 2D 标签转移到 3D 点云中，从而避免了在 3D 中进行昂贵和耗时的人工注释。我们引入了关于 2D 和 3D 语义分割的基准，并评估了各种最新的深度学习技术，以展示在自然环境中语义分割中的挑战。我们提出了供标准基准和域自适应基准使用的训练 - 验证 - 测试划分，并利用一种自动划分生成技术来确保类别标签分布的平衡。该数据集、评估脚本和预训练模型将在接受之后发布于该 URL。

Dec, 2023

用于开发和基准测试主动视觉的数据集

该论文使用真实影像，聚焦日常室内环境下机器人视觉任务的模拟，构建新的公共数据集。该数据集可用于机器人视觉任务中的物体检测、主动视觉模拟和基于深度学习的强化学习下的下一步动作预测。在使用数据集的过程中，作者发现现有物体检测研究最大的问题是机器人视角对物体尺度，遮挡和方向的影响。

Feb, 2017

基于视频序列的无监督物体表示基准测试

研究了四种基于物体的表征方法的感知能力，设计了一个基准测试集来评估物体检测、分割和跟踪的基本感知能力，并发现具有非约束潜在表征的架构比基于空间变换器的架构具有更强的物体感知能力。

Jun, 2020