MCL-3D: 使用 2D 图像加深度信息进行立体图像质量评估的数据库
本研究提出了适合评估单目深度预测方法三维几何质量的一组度量标准和室内基准测试 RIO-D3D,并展示了其对于评估三维场景完整性的紧密关联任务的帮助。
Mar, 2022
通过扩展多模态大语言模型 (MLLMs) 的感知能力以在三维空间中对图像进行定位和推理,本研究引入了一个名为 Cube-LLM 的新 MLLM,并在 LV3D 数据集上进行预训练,实验表明 Cube-LLM 在整体 MLLM 和特定领域的基准测试中均表现出色,并取得了显著的成果。
May, 2024
该研究论文通过大规模的三维多模态医学数据集 M3D-Data 和多模态大型语言模型 M3D-LaMed,在各种三维医学任务上实现了先进的医学图像分析方法,并提出了用于自动评估的新的三维多模态医学基准 M3D-Bench。
Mar, 2024
为了解决 3D 数据与 2D 图像和文本的对齐问题带来的信息退化、协同不足和细节利用不充分的挑战,本文介绍了一种综合点云、文本和图像的综合方法 JM3D,其关键贡献是结构化多模态组织器和联合多模态对齐,通过高效的微调将 3D 表示与大型语言模型相结合,JM3D-LLM 在 ModelNet40 和 ScanObjectNN 的评估中表现出优势,进一步证明了我们的表示转换方法的有效性。
Oct, 2023
本文提出了一种新的多视图立体(MVS)深度图计算优先级方法,该优先级方法在 MVS 算法执行之前进行两步操作,包括寻找匹配伙伴并根据观测质量对结果进行排名,另外还使用了一种基于机器学习的信心预测器,能够对图像星座的质量进行评估,并提出一种优先级方法来构建稳固的三维重建基础,实验表明使用该方法能够在文化遗产保护和建造重建领域中达到更好的重建质量。
Mar, 2018
本文提供了一组经过立体校正的卫星图像及其对应的地面真实位移图,以供研究者进行立体重建的进一步研究,该数据集包括来自两个源的 10 个感兴趣区域,其中 8 个来自 IARPA 的 MVS Challenge 数据集,2 个来自 CORE3D-Public 数据集。
Jul, 2019
本文提出了一种处理多视图卫星图像生成 3D 数字表面模型的自动化流程,其中包括自动地地理参考和基于匹配生成高质量密集点云。通过学习样本 LiDAR 数据的关键配置,我们根据结果的接近程度对图像对进行排名,并使用自适应 3D 中值滤波器融合多个深度图。我们证明了提出的自适应中值滤波器通常比普通中值滤波器产生更好的结果,在最佳情况下达到了 0.36 米 RMSE 的精度提高。结果和分析被详细介绍。
May, 2019
研究人员创建了腾讯 - 动态彩色网格数据库(TDMD),其中包含八个参考的动态彩色网格对象,用于研究不同类型的畸变对人类感知的影响,并提供了关于动态彩色网格压缩和相关任务的推荐。他们还在 TDMD 上评估了三种最先进的客观指标,包括基于图像、基于点和基于视频的指标,突显了每个指标的优缺点,并提供了在实际动态彩色网格应用中选择指标的建议。
Aug, 2023
本文提出了一种基于单张图像深度估计的 3D 物体检测方法,该方法利用细节和多个子任务提取视觉线索并生成多个深度估计值,再通过深度选择和组合策略得到单个深度估计值以提高精度和鲁棒性,在 KITTI 3D 物体检测基准测试中的表现甚至比当前最佳方法都要超过 20%。
May, 2022