Freeplane: 三面战机稀疏视图重建模型中的自由午餐解锁

Jun, 2024

Freeplane: 三面战机稀疏视图重建模型中的自由午餐解锁

Freeplane: Unlocking Free Lunch in Triplane-Based Sparse-View Reconstruction Models

Wenqiang Sun, Zhengyi Wang, Shuo Chen, Yikai Wang, Zilong Chen...

TL;DR通过对三角面的调制，我们提出了一种简单而有效的方法，用于提高前馈模型的生成质量，无需额外训练，且能够无缝集成到预训练模型中以增强其对生成多视图图像不一致性的鲁棒性。

Abstract

Creating 3d assets from single-view images is a complex task that demands a deep understanding of the world. Recently, feed-forward 3D generative models have made significant progress by training large reconstruction models on extensive 3D datasets, with →

3d assets feed-forward models triplanes generation quality multi-view images

发现论文，激发创造

三视图遇上高斯点云投影：使用 Transformer 快速且可推广的单视图 3D 重建

通过前向推理，我们介绍了一种从单张图像高效生成三维模型的新方法，利用基于 Transformer 的网络，即点解码器和三面解码器，通过混合的 Triplane-Gaussian 中间表示重建三维物体，从而在渲染速度和渲染质量上实现了平衡，并比之前的技术在质量和运行时间方面取得了更好的效果。

Dec, 2023

基于参考的三元面 3D 感知图像编辑

通过对 EG3D 的三平面空间的探索和演示，本研究提供了一个集成框架，用于实现高质量的基于参考的三维感知图像编辑，并通过创新的流程在三维感知图像编辑方面呈现出独特的视角。

Apr, 2024

PlaneFormers：从稀疏视图到三维重建

本文提出了一种用于从有限重叠的图像重建场景平面表面的方法，并介绍了一种新的基于 transformer 的简化方法，PlaneFormer，它是通过对 3D 感知平面记号应用变换器来进行 3D 推理。实验表明，本文的方法比之前的方法更加有效。

Aug, 2022

基于 ImageNet 中的野外图像的几何感知 3D 生成

从多样且非结构化的 Imagenet 数据集中，我们提出了一种从二维图像中重建三维几何模型的方法，使用高效的三平面表示法学习三维模型，并基于 StyleGAN2 的生成器架构对高度多样化的数据集进行调整，通过多视点辨别防止模式崩溃并提升训练稳定性。

Jan, 2024

PlaneDepth: 基于正交平面的自监督深度估计

本文提出了一种基于正交平面的深度估计方法 PlaneDepth，使自监督学习中的深度估计更为精确，同时解决了自动驾驶中分割、补洞等问题，实现了无监督地提取地面平面，为自动驾驶技术的发展提供了有效支持。

Oct, 2022

AirPlanes: 通过 3D 一致嵌入实现准确的飞机估计

本文提出一种新方法，通过预测多视角一致的平面嵌入来辅助几何方法，将点进行聚类成平面，从而解决了在场景中估计平面表面的问题，并在 ScanNetV2 数据集上表明，该方法优于现有方法和强基线的平面估计任务。

Jun, 2024

使用三面体扩散生成 3D 神经场

本研究提出了一种基于扩散模型的高效的神经场三维生成方法，通过将训练数据转换为连续占据场并将其分解为一组轴对齐的三面体特征表示来实现，训练过程中，采用现有的二维扩散模型对这些特征表示进行训练，生成高质量和多样性的三维神经场，且优于其他三维生成方法。

Nov, 2022

Tri$^{2}$-plane：使用特征金字塔进行三维角色重建

我们提出了一种名为 Tri$^2$-plane 的新方法，用于通过单目逼真体积头像重建，通过特征金字塔和三个自上而下的侧连接 Tri-planes 实现细节改进，并通过训练中的相机几何感知滑动窗口方法提高鲁棒性，实验结果表明 Tri$^2$-plane 不仅超越了现有的方法，还在定量指标和定性评估方面取得了优越的性能。

Jan, 2024

三平面混合神经场的神经处理

本文通过对三平面离散数据结构进行处理，展示了该结构具有丰富的信息，可以通过标准深度学习模型进行有效处理，并在处理过程中实现了与处理显式表示结构相当的任务性能，同时保持了相同的重建质量。

Oct, 2023

DiffTF++：大词汇量三维生成的三维感知扩散变换器

通过引入一种基于扩散的前馈框架，以及使用改进的三面平面和 3D-aware 转换器、编码器 / 解码器来处理大规模的 3D 资源生成任务，该研究提出了一个更强的 3D 生成模型，以增强多样性、语义和质量。

May, 2024