- HumanSplat: 结构先验的适用于单一图像的通用人类高斯扩散
HumanSplat 通过在单个输入图像中预测任何人类的三维高斯 Splatting 属性,以解决高度精确的人体重建技术在广泛场景中受限于图像密集捕获要求或耗时的单例优化的问题。它由 2D 多视角扩散模型和具有人体结构先验的潜在重建转换器组 - 单视角图像中的可推广人类高斯模型
从单幅图像中学习可推广的三维人体高斯模型,通过扩散引导的三维人体建模框架,结合几何先验和注意机制,有效地恢复细节几何形状和外观,并具备在自然环境中的强大泛化能力。
- 基于 RGB 的一次性视角规划中利用来自 3D 扩散模型的先验知识
通过利用扩散模型的强大的 3D 生成能力作为先验,我们提出了一种新颖的一次性视图规划方法,从而实现了仅通过对象的单个 RGB 图像开始进行高效的一次性视图规划,以平衡对象重建质量和移动成本。
- CRM:利用卷积重建模型将单张图像转换为带纹理的三维网格
在这项工作中,我们提出了一种高保真度的单图像到 3D 生成模型,名为 Convolutional Reconstruction Model(CRM),该模型通过将几何先验融入到网络设计中,从而克服了稀疏 3D 数据的限制,并在仅 10 秒内 - PSDF: 基于先验的神经隐式表面学习用于多视图重建
使用预训练的 MVS 网络和 NISR 模型中的内在几何先验,在复杂的实际场景中实现高质量的神经隐式表面学习和精细重建,并提出可见性感知的几何一致性约束和基于外部几何先验的深度先验辅助采样,以及内部先验引导的重要渲染,以改进神经隐式表面重建 - 利用视点引导的球面映射改善语义对应
自监督表征学习在提取图像特征方面取得了近期的进展,但在面对对称性和重复部分等具有挑战性的图像特征时仍存在限制。为了解决这些限制,本文提出一种新的语义对应估计方法,将有区分度的自监督特征与三维理解相结合,通过弱几何球面先验进行补充。与更复杂的 - SAI3D:在 3D 场景中分割任意实例
SAI3D 是一种新颖的零样本三维实例分割方法,通过整合来自 Segment Anything Model (SAM) 的几何先验和语义线索,将三维场景划分为几何原语,然后逐步合并为与多视角 SAM 掩码一致的三维实例分割。通过具有动态阈值 - GenDepth:通过地平面嵌入泛化任意相机参数的单目深度估计
通过挑战传统趋势,本论文介绍了 GenDepth,一种能够适用于任意车载相机设置的新型模型,用于进行度量深度估计。通过创建具有不同车载相机系统的专门合成数据集,并结合对抗性域对齐的嵌入式镜头参数的新方法,GenDepth 在多个自动驾驶数据 - 使用扩散模型进行点云预训练
通过提出一种新的预训练方法 PointDif,本文在点云领域实现了显著的改进,包括基于条件点生成器的生成复原的点云和利用全局几何先验和物体全局点密度分布来捕捉局部和全局特征,从而在分类、分割和检测等多个下游任务中取得了实质性的提升。
- 几何神经扩散进程
本文将扩展扩散模型的框架,将几何先验引入无限维建模,并通过构建噪声过程和近似得分实现对称性,展示了该模型适用于模拟扩散模型的任意对称性情景以及在复杂的合成场景和天气数据上的可扩展性和容量。
- CVPR神经体积记忆用于视觉行动控制
利用单目深度相机、神经体积记忆和几何先验知识,提出了一种新的方法来解决多种恶劣地形条件下的机器人步态规划问题。
- ICLR使用随机拉普拉斯特征在双曲空间中学习
本文介绍了一种利用超几何空间的嵌入方法提高图数据的建模效率和性能的新算法,以及如何通过 Laplace 算子的本征函数来逼近超几何空间中的等度不变核,从而更好地实现了超几何网络的建模。
- CVPRNICE-SLAM: 神经隐式可扩展编码用于 SLAM
本文介绍了一个名为 NICE-SLAM 的密集 SLAM 系统,它通过引入分层场景表示来结合多层次的局部信息,并通过预训练的几何先验来优化该表示,从而在大型室内场景中实现了细节重建。与最近的神经隐式 SLAM 系统相比,我们的方法更具可扩展 - ICCV三维人体姿态估计的跨视角融合
该研究提出了一种基于多视角几何先验的方法,通过逐步改进三维姿态的准确性来从多视角图像中恢复绝对三维人体姿态。
- 利用几何在主动学习中进行图像分割
本文提出了一种主动学习方法,利用几何先验知识简化三维图像体积中的注释过程,选择最需要注释的体素,并保证它们位于二维平面贴片上,从而比随机分布体素更容易进行注释。在电子显微镜和磁共振成像体积以及自然图像上评估该方法的性能,与几个公认的基准线比 - CVPR深层轮换散射用于目标分类
本文介绍一种基于波浪变换滤波器的深度散射卷积网络,通过引入几何先验知识来细化图像特征提取,从而实现图像分类和理解的目标。