DatasetNeRF:基于生成辐射场的高效三维感知数据工厂
我们提出了一种新颖的方法,通过利用神经辐射场(NeRFs)从二维监督中进行三维语义分割,通过提取表面点云上的特征,实现了场景的紧凑表示,这种表示对于三维推理而言具有高效的采样并且适于少样本分割。我们的方法不依赖于场景参数化,可以适用于任何类型的 NeRF 场景。
Oct, 2023
本研究提出了一种新的 3D 到 2D 标签转换方法 - Panoptic NeRF 用于语义分割和实例分割任务,它利用了现有数据集中 2D 语义线索和粗糙 3D 标注信息的统一,实现了多视角一致的二维标签生成,可以提高多视角下的几何语义渲染准确性,消除粗糙 3D 标注的标签歧义和 2D 语义标注的噪声,与其他标签转移方法相比,在 KITTI-360 数据集的城市场景中,Panoptic NeRF 在准确度和多视角一致性方面表现更好。
Mar, 2022
该研究提出了一种使用神经辐射场(NeRF)生成 3D 人体姿势数据集的端到端框架,该方法通过训练预训练的姿势估计器优化生成的数据分布,从而提高模型的鲁棒性。实验证明,该方法相对于基准模型提高了 6% 的预测准确率。
Dec, 2023
这篇论文介绍了一种名为 Instance NeRF 的学习型 NeRF 3D 实例分割管道,它采用 3D 提案基于掩膜预测网络,可以学习给定场景的 3D 实例分割,并在任意 3D 点查询实例信息,超越了以前的 NeRF 分割方法和具有竞争力的 2D 分割方法。
Apr, 2023
提出了一种基于 3D-SGAN 的语义指导生成模型,利用生成神经辐射场(GNeRF)提取人体的隐式 3D 表示,并用纹理生成器将语义掩码转换为真实图像,为计算机图形学应用中的非刚性物体生成具有照片级真实感的图像。在 DeepFashion 数据集上,比最新的基准表现显著优秀。
Dec, 2021
该论文介绍了一种新的基于神经网络点云的辐射场模型 ——Point-NeRF,它结合了 NeRF 和深度多视图立体成像两种方法的优点,可用于高质量的视图合成和快速的场景几何重建。Point-NeRF 可以通过射线行走的渲染管道有效地渲染神经点特征,相对于 NeRF 具有快速训练和处理 3D 重建错误和异常数据的优势。
Jan, 2022
DistillNeRF 是一个自监督学习框架,专注于理解自动驾驶中基于有限 2D 观测的 3D 环境。该方法通过稀疏的、单帧的多视角相机输入,预测丰富的神经场景表示,并通过可微分渲染进行自监督训练以重构 RGB、深度或特征图像。实验证明,DistillNeRF 在场景重建、新视角合成、深度估计和 3D 语义占用预测等方面明显优于现有自监督方法。
Jun, 2024
本文提出 EfficientNeRF,一种高效的基于 NeRF 的方法,用于表示 3D 场景和合成新视图图像。通过在粗略和精细阶段分别提出有效的和关键的采样方法,以显著提高采样效率。同时,设计一种新的数据结构来加速整个场景的缓存以加速渲染速度。结果表明,本方法可以缩短 88% 以上的训练时间,实现超过 200 FPS 的渲染速度,而仍保持竞争力的准确性,从而促进 NeRF 在现实世界中的实际应用和推广。
Jun, 2022
使用多视图输入合成新视图图像,神经辐射场(NeRF)已成为三维视觉中的热门研究课题。本文提出了一种具有一般化语义神经辐射场(GSNeRF)的方法,该方法独特地将图像语义纳入合成过程中,从而能够对未见场景生成新视图图像和相关的语义地图。我们的 GSNeRF 由两个阶段组成:语义地理推理和深度引导的视觉渲染。前者能够从场景中观察多视图图像输入,提取语义和几何特征。在后者的指导下,利用得到的图像几何信息,进行图像和语义渲染,从而提高性能。我们的实验证实了 GSNeRF 在新视图图像和语义分割合成方面优于先前的工作,并进一步验证了我们的采样策略的有效性。
Mar, 2024
DecentNeRF 是第一次尝试的去中心化、众包的神经辐射场(NeRFs),与集中式方法相比,它在训练过程中减少了服务器计算成本,并通过将用户的 3D 视图分解为个人和全局 NeRFs 以及一种新颖的最优加权聚合,实现学习具有照片级真实感的场景表示。它在结构化合成和真实世界照片旅游数据集上验证了我们的方法学习 NeRFs 具有照片级真实感和最小的服务器计算成本,并进一步分析了 DecentNeRF 中全局 NeRFs 的安全聚合如何最小化服务器对个人内容的不良重建。
Mar, 2024