MCL-3D: 使用 2D 图像加深度信息进行立体图像质量评估的数据库

Mar, 2014

MCL-3D: 使用 2D 图像加深度信息进行立体图像质量评估的数据库

MCL-3D: a database for stereoscopic image quality assessment using 2D-image-plus-depth source

Rui Song, Hyunsuk Ko, C.C. Jay Kuo

TL;DR本研究介绍了使用 2D 图像加深度源渲染的新立体图像质量评估数据库 MCL-3D，并使用该数据库介绍了几种已知的 2D 和 3D 图像质量度量的性能基准测试。

Abstract

A new stereoscopic image quality assessment database rendered using the 2d-image-plus-depth source, called MCL-3D, is described and the performance benchmarking of several known 2D and 3D →

stereoscopic image quality assessment 2d-image-plus-depth source image-plus-depth sources depth image-based rendering image quality metrics

发现论文，激发创造

结合双目立体视觉和单目结构光的深度估计

本文介绍了一种新型立体系统，利用 IR 相机和结构光方法提高了匹配精度，通过在室内场景中的测试数据证明了该系统的有效性。

Mar, 2022

从二维到三维：重新思考单眼深度预测的基准测试

本研究提出了适合评估单目深度预测方法三维几何质量的一组度量标准和室内基准测试 RIO-D3D，并展示了其对于评估三维场景完整性的紧密关联任务的帮助。

Mar, 2022

具备 3D 理解的语言 - 图像模型

通过扩展多模态大语言模型 (MLLMs) 的感知能力以在三维空间中对图像进行定位和推理，本研究引入了一个名为 Cube-LLM 的新 MLLM，并在 LV3D 数据集上进行预训练，实验表明 Cube-LLM 在整体 MLLM 和特定领域的基准测试中均表现出色，并取得了显著的成果。

May, 2024

M3D：利用多模态大型语言模型推进 3D 医学图像分析

该研究论文通过大规模的三维多模态医学数据集 M3D-Data 和多模态大型语言模型 M3D-LaMed，在各种三维医学任务上实现了先进的医学图像分析方法，并提出了用于自动评估的新的三维多模态医学基准 M3D-Bench。

Mar, 2024

JM3D 和 JM3D-LLM：借助联合多模态提示提升 3D 表示

为了解决 3D 数据与 2D 图像和文本的对齐问题带来的信息退化、协同不足和细节利用不充分的挑战，本文介绍了一种综合点云、文本和图像的综合方法 JM3D，其关键贡献是结构化多模态组织器和联合多模态对齐，通过高效的微调将 3D 表示与大型语言模型相结合，JM3D-LLM 在 ModelNet40 和 ScanObjectNN 的评估中表现出优势，进一步证明了我们的表示转换方法的有效性。

Oct, 2023

使用置信度预测的多视角优先级立体深度图生成

本文提出了一种新的多视图立体（MVS）深度图计算优先级方法，该优先级方法在 MVS 算法执行之前进行两步操作，包括寻找匹配伙伴并根据观测质量对结果进行排名，另外还使用了一种基于机器学习的信心预测器，能够对图像星座的质量进行评估，并提出一种优先级方法来构建稳固的三维重建基础，实验表明使用该方法能够在文化遗产保护和建造重建领域中达到更好的重建质量。

Mar, 2018

卫星图像新的立体基准数据集

本文提供了一组经过立体校正的卫星图像及其对应的地面真实位移图，以供研究者进行立体重建的进一步研究，该数据集包括来自两个源的 10 个感兴趣区域，其中 8 个来自 IARPA 的 MVS Challenge 数据集，2 个来自 CORE3D-Public 数据集。

Jul, 2019

高分辨率多视角卫星图像自动 3D 恢复

本文提出了一种处理多视图卫星图像生成 3D 数字表面模型的自动化流程，其中包括自动地地理参考和基于匹配生成高质量密集点云。通过学习样本 LiDAR 数据的关键配置，我们根据结果的接近程度对图像对进行排名，并使用自适应 3D 中值滤波器融合多个深度图。我们证明了提出的自适应中值滤波器通常比普通中值滤波器产生更好的结果，在最佳情况下达到了 0.36 米 RMSE 的精度提高。结果和分析被详细介绍。

May, 2019

TDMD：面向动态彩色网格主观和客观质量探索的数据库

研究人员创建了腾讯 - 动态彩色网格数据库（TDMD），其中包含八个参考的动态彩色网格对象，用于研究不同类型的畸变对人类感知的影响，并提供了关于动态彩色网格压缩和相关任务的推荐。他们还在 TDMD 上评估了三种最先进的客观指标，包括基于图像、基于点和基于视频的指标，突显了每个指标的优缺点，并提供了在实际动态彩色网格应用中选择指标的建议。

Aug, 2023

多样性很重要：充分利用深度线索实现可靠的单目三维物体检测

本文提出了一种基于单张图像深度估计的 3D 物体检测方法，该方法利用细节和多个子任务提取视觉线索并生成多个深度估计值，再通过深度选择和组合策略得到单个深度估计值以提高精度和鲁棒性，在 KITTI 3D 物体检测基准测试中的表现甚至比当前最佳方法都要超过 20%。

May, 2022