- SyncNoise: 文本驱动的三维场景编辑中的几何一致噪声预测
基于 2D 扩散模型的视觉编辑已经取得了显著的能力,但如何在多个视角上实现一致的编辑仍然是一个挑战。本文提出了 SyncNoise,一种新颖的几何引导的多视角一致噪声编辑方法,通过同步编辑多个视角以强制实现几何一致性,从而确保了语义结构和低 - GScream: 学习三维几何和特征一致的高斯插值方法用于物体去除
通过使用三维高斯图案生成器更新辐射场,本研究论文解决了对象去除的复杂挑战,主要挑战在于在高斯图案的离散性质中保持几何一致性和纹理协调性。通过优化高斯图案的定位以提高去除区域和可见区域的几何一致性,再结合跨注意力设计的新颖特征传递机制来增强纹 - 几何一致性下的部分对部分形状匹配
我们的研究建立在几何一致性为重要约束的基础上,利用三角形乘积空间的新型整数非线性规划形式和基于线性整数规划的剪枝算法,在部分 - 部分匹配中实现了几何一致性,并生成了一个新的跨类别数据集,我们的方法在已有的类内数据集和我们的新跨类别数据集上 - Diffusion$^2$: 通过正交扩散模型的得分组合生成动态 3D 内容
Diffusion$^2$ 是一种新颖的框架,通过从视频数据和多视图扩散模型获取几何一致性和时间平滑性的知识,直接生成密集的多视图和多帧图像,优化连续性 4D 表示,从而在几分钟内生成 4D 内容。
- CVPR学习不可靠性:利用相对几何一致性进行快速的少样本体素辐射场
使用基于体元的优化框架 ReVoRF,针对伪新视图合成中的不可靠性问题,利用相对深度关系和绝对颜色值之间的权衡,通过双边几何一致性损失和可靠性引导学习策略,实现了对数据的更细粒度利用和增强重建质量,显著提高效率和准确性。
- CVPR几何感知深度完整性的三视角视图分解
通过 Tri-Perspective view Decomposition (TPVD) 框架,该研究旨在解决自动驾驶中的深度完成任务,并且能够更准确地重建稀疏和嘈杂深度测量所对应的场景的精确 3D 几何形状。通过 TPVD 的分解和合并方 - CVPR学习动态四面体进行高质量的说话头部合成
通过神经网络对显式动态网格进行编码的混合表示方法 Dynamic Tetrahedra (DynTet) 提供了一种有效的几何一致性,解决了在准确建模复杂面部变形方面缺乏显式几何约束的困境。与以往的工作相比,DynTet 在保真度、口型同步 - 用于文本到 3D 生成的检索增强得分蒸馏
通过检索辅助的方法,RetDream 解决了文本到 3D 生成中存在的 3D 几何不一致问题,并实现了几何一致性和生成场景的忠实度的显著改进。
- SOS-SLAM: 面向非结构化环境的开放集合 SLAM 中的分割
一个新颖的开放式同步定位与地图构建(SLAM)框架,通过分割方法在无结构环境中创建对象地图和对象之间的几何关系以进行定位,该方法相对于传统基于特征和全局描述符的 SLAM 系统更具鲁棒性,在照明和外观变化方面表现更好,并且在定位性能方面超过 - Cascade-Zero123: 单幅图像到高度一致的 3D 图像的自提近景方法
从一张单一图像中综合多视图 3D 是一项重要且具有挑战性的任务。为了解决这个问题,Zero-1-to-3 方法旨在将二维潜在扩散模型推广到三维范围。我们提出了一个由两个 Zero-1-to-3 模型构建的级联生成框架,名为 Cascade- - 重新 Nerfing: 通过新视角合成对神经辐射场施加几何约束
通过 Re-Nerfing 方法,我们在 Neural Radiance Fields 的基础上使用多阶段的方法增加场景的覆盖范围,提高新视角的几何一致性,并通过新合成的图像实现结构和极线约束的优化,对 mip-NeRF 360 数据集进行 - ColonNeRF:用于高保真长序列结肠镜重建的神经辐射场
基于神经辐射场(NeRF)的新重建框架 ColonNeRF,通过重建结构的多分区组合、多级融合以及密集化相机姿势来解决结肠镜检查重建中的形状差异、几何一致性和视角稀疏性等挑战,显著优于现有方法。
- GC-MVSNet:多视角,多尺度,几何一致的多视图立体视觉
本文介绍了一种新的方法,通过在学习过程中明确地鼓励多个源视图的参考视图深度图的几何一致性,加速学习过程,达到了 DTU 和 BlendedMVS 数据集的最新技术水平,并在 Tanks and Temples 基准上获得了有竞争力的结果。据 - ImageManip: 图像基于机器人操作的可支配性导向下一视角选择
基于图像的机器人操纵系统,利用多个视角捕捉目标物体,推断深度信息以补充其几何信息,采用几何一致性融合视角,实现精确操纵决策。
- 快速离散优化用于几何一致的三维形状匹配
结合学习和组合形式主义,提出一种新的组合求解器,应用于三维形状匹配,解决了学习方法和公理化方法之间的局部不平滑性和问题规模以及非凸优化问题的计算成本的问题。
- ReShader:基于视角的单图像视图合成中的亮点
通过将视图合成过程分为像素重新着色和重定位的两个独立任务,我们提出使用神经网络进行重新着色,并生成一组大规模的合成输入 - 重新着色对来训练我们的网络,从而在多种实际场景中产生具有真实移动亮点的合理的新视图图像。
- 几何一致的部分形状匹配
该论文提出了一种整合先进的深度形状特征到新型整数线性规划部分形状匹配公式的优化方法,能够在低分辨率的形状上获得全局最优解,并通过粗到精的过程进行改进,相比于现有的几何一致算法,我们的方法在处理部分形状时能够找到更可靠的结果且匹配更为平滑,同 - ICCV三维隐式运输器用于时态一致的关键点发现
采用关键点为基础的表征在各种视觉和机器人任务中证明了优势。然而,现有的二维和三维关键点检测方法主要依赖几何一致性实现空间对齐,忽视了时间一致性。为了解决这个问题,介绍了用于二维数据的传输器方法,从源帧重构目标帧以包含空间和时间信息。然而,将 - ICCV用于实际定位和建图的全景景深估计校准
通过利用全景图像的综合视角,我们提出了一种自监督学习的方法,通过构建当前深度预测的 3D 点云并在不同视角投影点云,或者对当前输入图像进行拉伸生成合成全景图,进而最小化合成图像估计的 3D 结构的差异,从而在机器人导航和无地图定位任务中展现 - 通过诱导和限制表示进行等变单视角姿态预测
从二维图像中学习关于三维世界的知识是计算机视觉中的一个基本问题,本文提出了一种学习三维表示的算法,满足几何一致性约束,并在三个姿态预测任务中取得了 SOTA 结果。