Holopix50k: 大规模自然环境下的立体图像数据集

Mar, 2020

Holopix50k: 大规模自然环境下的立体图像数据集

Holopix50k: A Large-Scale In-the-wild Stereo Image Dataset

Yiwen Hua, Puneet Kohli, Pritish Uplavikar, Anand Ravi, Saravana Gunaseelan...

TL;DR本文描述了 Holopix50k 这一在野外采集的新型立体图像数据集，用于训练改进移动摄影场景下的立体超分辨率和无监督单目深度估计算法，并展示了该数据集的实际应用以激励新的作品和用例。

Abstract

With the mass-market adoption of dual-camera mobile phones, leveraging stereo information in computer vision has become increasingly important. Current state-of-the-art methods utilize learning-based algorithms, where the amount and quality of training samples heavily influence results

mobile phone stereo information computer vision stereo image dataset holopix50k

发现论文，激发创造

Flickr1024：用于立体图像超分辨率的大规模数据集

该研究提出了一个名为 Flickr1024 的大规模立体数据集，由于最近发布的智能手机中双摄像头的普及，越来越多的超分辨率方法被提出来用于增强立体图像对的分辨率，但是高质量三维立体数据集的缺乏限制了该领域的研究。实验表明，与 KITTI 和 Middlebury 数据集相比，Flickr1024 数据集有助于处理过度拟合问题，并显着改进了立体 SR 方法的性能。

Mar, 2019

深度立体视觉的挑战：Booster 数据集

我们提出了一个新颖的高分辨率、充满挑战性的立体数据集，并给出了密集准确的视差地面真值标注。该数据集独特之处在于存在一些具有镜面反射和透明性质的表面，这是当前立体网络失败的主要原因。我们的获取方法采用了一个新颖的深度时空立体框架，可以实现子像素精度的简单准确标注。我们释放了总共 419 个样品，收集自 64 个不同的场景并标注了密集的地面真值视差。每个样本包括一个高分辨率成对图像 (12 Mpx)，以及一个不对称的成对图像 (左边：12 Mpx，右边：1.1 Mpx)。此外，我们提供了手动注释的材质分割掩模和 15K 未标记样本。我们根据我们的数据集评估了最先进的深度网络，强调了它们在解决立体视觉中的开放挑战方面的局限性，并为未来的研究提供了一些线索。

Jun, 2022

360 度广域：深度预测与视角合成数据集

本文介绍了一个大规模 360 度视频数据集，包含各种环境和上下文，以及相机的姿态和深度图，证明了该数据集在单一图像深度估计和视图合成两个主要任务中的相关性。

Jun, 2024

WHU-Stereo：高分辨率卫星图像立体匹配的挑战基准

本研究创建了一份包含超过 1700 个成对高分辨率遥感卫星图像的 WHU-Stereo 数据集，以促进深度学习网络的立体匹配训练和测试，并探究其在遥感应用中的潜力。实验证明，该数据集的性能可与现有的立体匹配数据集可比，并且深度学习模型的性能要比手工设计的 SGM 算法更高。

Jun, 2022

HoliCity：面向学习全面三维结构的城市规模数据平台

HoliCity 是一种城市规模的三维数据集，具有丰富的结构信息，可用于从城市 CAD 模型中学习抽象的高级整体三维结构，并且对城市规模的重建、定位、映射和增强现实等应用具有支持作用。

Aug, 2020

多车立体事件相机数据集：用于三维感知的事件相机数据集

本文介绍了一个新的被动感知方式 —— 事件相机，可以完成多种 3D 感知任务，并提供了一个涵盖各种环境和照明水平的大型数据集，包括了事件流、灰度图像和 IMU 读数，并提供了真确的姿势和深度图像。同时还提供了来自基于框架的立体相机系统的同步灰度图像和 IMU 读数的比较。

Jan, 2018

SPair-71k：用于语义对应的大规模基准测试数据集

该论文提出一种新的大规模基准数据集 SPair-71k 用于在计算机视觉领域解决语义对应问题，其中包含大量变化视角和尺度的图像，从而为解决语义对应问题提供了可靠的测试基础和促进此领域的进一步发展。

Aug, 2019

用于多视角三维重建的现实数据集

本文介绍了一种包含近千个三维对象模型及超过 84 万个现实世界的 RGB 和深度图像数据集，旨在填补现有研究中缺乏的三维多视图重建的真实数据基准。该数据集通过半自动方式实现相机位置与物体姿态的精准标注，为形状重建、物体姿态估计、形状检索等 3D 应用提供了可能。数据集已开放，包含注释工具和评估基准源代码。

Mar, 2022

一个用于改善补丁匹配的大型数据集

我们提出了一个新的数据集，用于学习本地图像描述符，可用于显着改善补丁匹配。此新数据集的训练效果比目前的 Multi-View Stereo (MVS) 数据集更好，并且还提供了补充信息，例如 RGB 补丁、相机参数等。我们使用此数据集训练现有的最先进模型，并在公开基准测试中获得了比 MVS 数据集训练的最先进描述符更好的性能。

Jan, 2018

SmartPortraits：基于深度的手持智能手机人像数据集，用于状态估计、重建和合成

本文提供了一个包含 1000 个有人像的视频序列的数据集，主要目的是弥合从智能手机获取到的原始测量结果与下游应用之间的差距，并通过评估多种状态下最先进的相机对齐方法来提供智能手机视觉 - 惯性基准，其中提供了不同方法的结果，并激励在视图合成和三维重建任务中进一步使用提供的轨迹，可用于人像捕获的摄像机对齐和闪光灯辅助测量等。

Apr, 2022