Freeplane: 三面战机稀疏视图重建模型中的自由午餐解锁
通过前向推理,我们介绍了一种从单张图像高效生成三维模型的新方法,利用基于 Transformer 的网络,即点解码器和三面解码器,通过混合的 Triplane-Gaussian 中间表示重建三维物体,从而在渲染速度和渲染质量上实现了平衡,并比之前的技术在质量和运行时间方面取得了更好的效果。
Dec, 2023
通过对 EG3D 的三平面空间的探索和演示,本研究提供了一个集成框架,用于实现高质量的基于参考的三维感知图像编辑,并通过创新的流程在三维感知图像编辑方面呈现出独特的视角。
Apr, 2024
本文提出了一种用于从有限重叠的图像重建场景平面表面的方法,并介绍了一种新的基于 transformer 的简化方法,PlaneFormer,它是通过对 3D 感知平面记号应用变换器来进行 3D 推理。实验表明,本文的方法比之前的方法更加有效。
Aug, 2022
从多样且非结构化的 Imagenet 数据集中,我们提出了一种从二维图像中重建三维几何模型的方法,使用高效的三平面表示法学习三维模型,并基于 StyleGAN2 的生成器架构对高度多样化的数据集进行调整,通过多视点辨别防止模式崩溃并提升训练稳定性。
Jan, 2024
本文提出了一种基于正交平面的深度估计方法 PlaneDepth,使自监督学习中的深度估计更为精确,同时解决了自动驾驶中分割、补洞等问题,实现了无监督地提取地面平面,为自动驾驶技术的发展提供了有效支持。
Oct, 2022
本文提出一种新方法,通过预测多视角一致的平面嵌入来辅助几何方法,将点进行聚类成平面,从而解决了在场景中估计平面表面的问题,并在 ScanNetV2 数据集上表明,该方法优于现有方法和强基线的平面估计任务。
Jun, 2024
本研究提出了一种基于扩散模型的高效的神经场三维生成方法,通过将训练数据转换为连续占据场并将其分解为一组轴对齐的三面体特征表示来实现,训练过程中,采用现有的二维扩散模型对这些特征表示进行训练,生成高质量和多样性的三维神经场,且优于其他三维生成方法。
Nov, 2022
我们提出了一种名为 Tri$^2$-plane 的新方法,用于通过单目逼真体积头像重建,通过特征金字塔和三个自上而下的侧连接 Tri-planes 实现细节改进,并通过训练中的相机几何感知滑动窗口方法提高鲁棒性,实验结果表明 Tri$^2$-plane 不仅超越了现有的方法,还在定量指标和定性评估方面取得了优越的性能。
Jan, 2024
本文通过对三平面离散数据结构进行处理,展示了该结构具有丰富的信息,可以通过标准深度学习模型进行有效处理,并在处理过程中实现了与处理显式表示结构相当的任务性能,同时保持了相同的重建质量。
Oct, 2023
通过引入一种基于扩散的前馈框架,以及使用改进的三面平面和 3D-aware 转换器、编码器 / 解码器来处理大规模的 3D 资源生成任务,该研究提出了一个更强的 3D 生成模型,以增强多样性、语义和质量。
May, 2024