- 多无人机合作巡检路径规划的蚁群优化
本文提出了一种基于群体智能的方法,用于解决无人机的合作路径规划问题,该问题对于基础设施的自动检查至关重要。该方法使用结构的三维模型生成无人机的视点,并考虑无人机编队模型、相机参数和数据后处理要求的约束,计算视点。然后,将视点作为输入,将路径 - 基于场景坐标回归的 X 光至 CT 刚体配准
该研究提出了一种完全自动的注册方法,基于卷积神经网络,用于将术中获得的 X 光图像与预先获得的三维模型进行对齐,从而降低术中图像中重叠解剖结构对外科医生的心理负担。实验结果表明,该方法在盆腔注册中的平均目标配准误差为 3.79 毫米,在真实 - 实现全球范围的交通摄像头校准
通过利用街景图像重建度量的三维模型并精确校准 100 多个全球交通摄像头,本研究展示了一个可扩展的框架,以解决基于野外摄像头的精确校准挑战,并通过提取信息进行交通分析,从而开发出利用室外摄像头进行自动分析的潜力。
- 微重力环境下多智能体三维地图重建和变化检测的自由飞行机器人
建议一个多智能体合作、能够进行地图绘制和变化检测的框架,旨在为未来的微重力后勤外科小型天然卫星上的协助性自由飞行机器人提供独立运行能力。
- 高质量神经对象克隆与三维分割提升
通过将 Segment Anything Model(SAM)中的 2D 分割掩膜传递到统一的 3D 变化场中,然后进一步将 SAM 编码器的 2D 特征提取到 3D SAM 场中,提出了 Neural Object Cloning(NOC - CVPR神经场景编年史
本文旨在从互联网照片中重建一个可呈现照片逼真效果、拥有独立控制视角、照明和时间的三维模型。我们使用一种新的场景表示,并提出了一种新的时态步函数编码方法,可以将离散场景级内容变化建模为时间上的分段常函数,从而实现了对视角、时间和照明的独立控制 - GMS-3DQA:基于投影的网格小块采样用于 3D 模型质量评估
该研究提出了一种新的基于投影的 3D 模型质量评估方法 - GMS-3DQA,通过使用多投影网格小块采样策略减少冗余和推理资源,并使用 Swin-Transformer 微型骨干从采样的网格小块中提取质量感知特征,实验结果表明,该模型相比现 - 光谱 3D 计算机视觉 -- 综述
该研究概述了光谱 3D 计算机视觉的方法,应用领域和未来挑战。该技术结合了几何和光谱分析,能够从电磁谱中获得更多物体信息,并在 3D 模型中显示物体特性,如反射率,色差和并不相同的明暗对比度等。该技术已在许多领域发现了应用,例如智能农业,环 - CA$^2$T-Net: 单张图片的类别无关的三维骨骼动作迁移
本研究使用神经网络方法实现单张图片到静止 3D 模型之间的运动转移,通过预测物体姿态、部件分割和相应的运动参数来复制输入图片中呈现的曲折运动,该方法适用于任意类别的物体且只用合成数据进行训练。
- ECCV神经对应场用于物体姿态估计
本文提出一种方法,通过单个 RGB 图像估计刚性物体的六自由度姿态,其中通过 3D 模型在摄像机视锥中采样三维查询点预测三维物体坐标,并借助全连接神经网络来实现神经对应场,最终使用 Kabsch-RANSAC 算法实现姿态估计,该方法在三个 - 使用预训练的图文模型从文本生成带纹理的三维模型
基于预训练的 CLIP 模型,我们提出了一种从输入的文本提示中生成 3D 模型的零样本生成技术。通过对网格参数的优化,我们可以直接生成形状、纹理或两者,而无需进行培训。
- LOLNeRF: 从一张图片中学习
本文提出了利用神经辐射场学习单个视角下的 3D 物体建模方法,并通过类别级别的训练数据来重建物体外形,进而实现新视角综合渲染和单目深度估计的高精度结果。
- 通过无监督体积分割将 3D 场景分解为对象
ObSuRF 为将场景单张图像转化为一组 Neural Radiance Fields (NeRFs) 三维模型的方法,可用于多视角的 CLEVR 以及将场景 populate 为 ShapeNet 模型的数据集中,在不需要监督的情况下实现 - CVPRDiNTS:可微分神经网络拓扑搜索用于 3D 医学图像分割
本文提出了一种基于可微搜索框架的不同 iable 网络拓扑搜索方案,以支持快速梯度搜索,同时遵循高度灵活的多路径网络拓扑结构,高度减少了搜索的 GPU 内存使用,此模型在医学分割竞赛中成为了最具有竞争力的方法。
- MM利用基于模型的方法和深度 - 彩色图像识别手的 26 自由度
研究了一个基于数据模型的手势识别方法,利用 RGB-D 图像和手模型来实现, 并采用粒子群优化算法和 GPU 并行计算来解决高维度空间下的优化问题。该算法性能稳定且快速,处理每帧时间为 0.8 秒。
- 通过容积网络预测 3D 关节动画骨骼
本文提出了一种基于堆叠沙漏模型的学习方法,用于预测具有关节的 3D 角色模型的动画骨骼系统,通过对从网络上挖掘的大型 3D 角色数据集进行训练,得到的方法非常类似于人类创作,同时保证骨骼系统与输入的 3D 模型具有结构和几何的匹配性,具有较 - ICCVPro-Cam SSfM:移动式光投影相机系统用于结构和光谱反射
本文介绍了一种新型的投影仪 - 相机系统,可实现对物体的密集三维建模和光谱反射性质的低成本获取,该系统利用标准 RGB 相机和现成投影仪进行光照和结构估计,通过多视点结构光和 SfM 技术完成构建,并通过多光谱成像估计每个 3D 点的光谱反 - CVPR通过单张图片捕捉 3D 手、面部和身体表达
本研究提出了通过单目图像计算实现人体姿态、手部姿态和面部表情三维模型的方法,主要使用了一个新的、一致的、包含完全表达手和面部表情的人体模型 SMPL-X,可以对受控图像和自然环境图片进行三维模型匹配。
- 学习转换同步
本研究提出使用神经网络学习各种相对变换之间的权重来提高图像对齐的质量,在众多数据集中证明了该方法的有效性。
- 使用指导视角规划器进行主动物体重建
该论文提出了一种基于深度学习的主动重建模型,利用引导视图规划来重建一个三维模型,其中包括了信息获取模型的学习和信息聚合的方法,实验表明该模型比其他方法更能提高重建精度和预测一个更具信息性的视图序列来完成对象重建。