- SDL-MVS:遥感中多视图立体重建的视图空间和深度可变学习方法
基于遥感图像的多视图立体匹配研究推动了大规模城市三维重建的发展,提出了一种基于视点空间和深度可变学习的新范式(SDL-MVS),通过可变学习范式进行视点空间和深度的变形,实现了准确的多视图深度估计。
- 基于神经网络的单视角 2D 视频棒球投球轨迹跟踪与三维重建
本文介绍了一种基于神经网络的方法,用于从 2D 视频片段到 3D 坐标的跟踪和重构棒球投球轨迹。该方法利用 OpenCV 的 CSRT 算法准确跟踪 2D 视频帧中的棒球和固定参考点,然后使用跟踪的像素坐标作为我们的神经网络模型的输入特征, - 智能医学图像分析中的多尺度图像融合系统探索
这篇研究论文介绍了一种基于 U-Net 的 MRI 算法,结合了残差网络和用于增强上下文信息的模块,还添加了空洞卷积池化金字塔用于处理。实验证明了该算法在诊断脑胶质瘤的 MRI 图像分割中取得了较高的准确率,并提升了脑肿瘤的三维重建精度,以 - EvGGS: 一种用于事件驱动广义高斯绘制的协同学习框架
通过事件输入,我们提出了首个基于事件的通用三维重构框架 EvGGS,它以前馈方式从事件输入中将场景重构为三维高斯场,并可以泛化到未见过的情况,无需重新训练。
- CAT3D: 利用多视角扩散模型创建三维任何物体
用于高质量 3D 捕捉的 CAT3D 方法模拟实际捕捉过程中的多视图扩散模型,通过给定任意数量的输入图像和一组目标新视点,生成高度一致的场景新视图,可用作强大的 3D 重建技术的输入,以实时渲染任意视点的 3D 表示。CAT3D 在短短一分 - 动态 NeRF:综述
Neural Radiance Field 是一种新颖的隐式方法,用于高分辨率的三维重建和表示;动态 NeRF 是更实际和实用的研究方向,具有更多潜力。
- CVPRMVDiff: 可扩展灵活的多视图扩散用于从单视图进行 3D 物体重建
通过引入情景表示变换器和视图条件扩散模型,该论文提出了一个通用框架,用于从单个图像生成一致的多视图图像。通过多视图注意力和极线几何约束来确保三维一致性,该模型能够从仅一个图像输入生成超过基准方法在评估指标(包括 PSNR、SSIM 和 LP - HandSSCA: 从 RGB 图像中估计的 3D 手部网格重建
通过引入状态空间建模到手部姿态估计领域,我们提出了一种简单高效的三维手部网格重建网络 HandSSCA,其中设计了一种新颖的状态空间通道关注模块来提取空间维度上的手部特征并增强通道维度上的手部区域特征,实验结果表明我们的 HandSSCA - NC-SDF:使用具有视角相关法向量补偿的神经 SDF 增强室内场景重建
基于神经隐式表面表示的 3D 重建框架 NC-SDF,通过视角缺陷的学习和修正,提高了重建的全局一致性和局部细节,并通过信息丰富的像素采样策略和混合几何建模方法进一步改善了重建质量。
- RTG-SLAM:使用高斯喷洒实现大规模实时 3D 重建
通过使用高斯喷洒技术,我们提出了 RTG-SLAM,一个用于大规模环境的实时 3D 重建系统。与现有的基于 NeRF 的 RGBD SLAM 相比,我们的系统在速度和内存成本方面取得了可比的高质量重建,并且在新视角合成的逼真度和相机跟踪准确 - 从业余望远镜图像中三维重建卫星
通过利用小型业余望远镜捕获的视频数据,该研究提出了一个用于低地球轨道卫星的三维重建框架。该框架包括深度学习的图像恢复、特征点提取和相机姿态初始化的预处理流程,以及改进的三维高斯光滑算法应用于重构三维模型,通过支持训练和姿态估计产生精细的三维 - DIG3D: 高斯扩散融合可变形变换用于单张图像三维重建
利用单视角 RGB 图像进行三维重建及新视角合成的研究中,提出了一种名为 DIG3D 的新方法,该方法利用编码 - 解码框架,通过编码器的深度感知图像特征指导解码器生成三维高斯图像,具体来说,引入了可变形变换器,通过三维参考点和多层细化适应 - OMEGAS: 基于高斯分割的大型场景物体网格提取
从大场景中精确重建特定物体的 3D 重建技术进展,提出了一种名为 OMEGAS 的框架,通过分割引导和分析方法,实现了准确的物体分割和背景去除,从而有效地提取 3D 物体网格。
- 使用视觉惯性和深度惯性测量髌骨跟踪的 3D 手持式超声
通过结合二维超声波和运动跟踪,利用语义分割和位置配准进行三维重建,作者提出了一种用于监测关节运动的新方法,该方法能够在不需要昂贵的外部基础设施的情况下评估骨骼的三维重建准确性。
- 猜测未见之物:从部分二维闪烁中动态三维场景重建
通过单目视频输入的方法,本文提出了一种将世界和多个动态人物在 3D 中进行重构的方法,使用新兴的 3D 高斯涂布(3D-GS)表示法来表达世界和多个人物,解决了 3D 人物重构中常见的观测在 3D 空间中非常有限和稀疏的挑战,并演示了方法在 - 自动驾驶中的神经辐射场:一次综述
该论文提供了第一份有关神经辐射字段(NeRF)在自动驾驶领域应用的综合调查报告,并对感知、三维重建、同时定位和地图构建以及模拟等应用领域进行了深入分析和总结,并对未来研究方向进行了讨论。
- 统一场景表示和重建用于三维大型语言模型
本研究通过引入 Uni3DR^2 提取 3D 几何和语义感知表示特征的统一场景表示和重建框架,证明了该框架对于大型语言模型在 3D 场景中的重要性,并在多个实验中取得了令人信服的结果。
- 6Img-to-3D: 少图像大规模室外行驶场景重建
通过结合压缩的自注意力机制、不可微分体素渲染、场景压缩和图像特征投影等方法,我们提出了一种高效、可扩展的基于 Transformer 的编码器 - 渲染器方法,用于从单次拍摄的图像重建 3D 一致的参数化三平面,适用于大规模、无界的户外驾驶 - CryoMAE:基于掩蔽自动编码器的少样本冷冻电镜粒子挑选
利用少样本学习的蒙版自编码器方法(cryoMAE),克服了冷冻电子显微镜中粒子选择的问题,提高了三维重建分辨率 22.4%。
- LetsGo: 大规模车库建模与渲染的 LiDAR 辅助高斯基元
大型车库建模中的挑战以及一种利用 LiDAR 辅助的高斯打点方法进行车库建模和渲染的引入。使用手持式扫描仪 Polar 收集的 LiDAR 点云增强了车库场景建模和渲染的算法,提出了一种新颖的深度正则化器,同时探索了传统网格和现代高斯建模的