GP-NeRF：通用感知 NeRF 用于上下文感知 3D 场景理解

Nov, 2023

GP-NeRF：通用感知 NeRF 用于上下文感知 3D 场景理解

GP-NeRF: Generalized Perception NeRF for Context-Aware 3D Scene Understanding

Hao Li, Dingwen Zhang, Yalun Dai, Nian Liu, Lechao Cheng...

TL;DR提出了一种通用感知 NeRF（GP-NeRF）模型，通过引入 transformers 和自我蒸馏机制，实现了语义场和几何场的联合渲染，以促进具有上下文感知的三维场景理解。在评估中，使用合成和真实世界数据集进行了两个感知任务（即语义和实例分割）的实验比较，取得了显著的优于现有方法的效果。

Abstract

Applying nerf to downstream perception tasks for scene understanding and representation is becoming increasingly popular. Most existing methods treat →

nerf scene understanding semantic prediction context-aware 3d scene perception semantic segmentation

发现论文，激发创造

GSNeRF: 增强的通用语义神经辐射场与 3D 场景理解

使用多视图输入合成新视图图像，神经辐射场（NeRF）已成为三维视觉中的热门研究课题。本文提出了一种具有一般化语义神经辐射场（GSNeRF）的方法，该方法独特地将图像语义纳入合成过程中，从而能够对未见场景生成新视图图像和相关的语义地图。我们的 GSNeRF 由两个阶段组成：语义地理推理和深度引导的视觉渲染。前者能够从场景中观察多视图图像输入，提取语义和几何特征。在后者的指导下，利用得到的图像几何信息，进行图像和语义渲染，从而提高性能。我们的实验证实了 GSNeRF 在新视图图像和语义分割合成方面优于先前的工作，并进一步验证了我们的采样策略的有效性。

Mar, 2024

语义就够了：仅基于语义信息的 NeRF 重建

优化 Semantic-NeRF 模型以实现仅有语义输出，并移除 RGB 输出成分，通过对比实验证明这种改动对于场景理解、目标检测和分割等任务的影响，提供了渲染场景的新方式并促进了进一步的研究和发展。

Mar, 2024

基于几何指导的渐进式通用高效神经人体渲染

本研究提出了一种基于神经辐射场的高保真度自由视点下人体合成的通用且高效的管道，其中利用几何引导的多视点特征整合方法和渐进式渲染管道通过提供完整的几何体积和预测的密度值来显著提高多个泛化设置下的综合性能和渲染效率。

Dec, 2021

专注特定物体的 NeRF

通过利用场景语义先验，加快训练速度和提高渲染效果，本文改进了 NeRF-based 模型，在特定目标上进行快速训练，并且对所有 NeRF-based 模型都适用。此外，通过稀疏采样负射线样本并研究弱监督方法，进一步加速训练并保持渲染质量。最后，通过扩展像素语义和颜色渲染公式，提出了一种新的场景编辑技术，以实现特定语义目标的独特显示或在渲染中进行掩盖。同时，通过结合形态学运算和聚类，设计了自监督循环来解决场景中无监督区域的不正确推断问题。

Aug, 2023

GeoNeRF：利用几何先验的通用 NeRF

该论文提出了一种基于神经辐射场的通用逼真新视角合成方法，该方法包括几何推理和渲染两个主要阶段，可用于各种合成和实际数据集。

Nov, 2021

减肥版 NeRF：语义一致的少样本视角合成

DietNeRF 通过引入辅助语义一致性损失，使用预训练的视觉编码器，改进了使用较少图像时的神经辐射场的视图合成，从而提高了感知质量。

Apr, 2021

全景城市场景分割的 3D 到 2D 标签转移的 Panoptic NeRF

本研究提出了一种新的 3D 到 2D 标签转换方法 - Panoptic NeRF 用于语义分割和实例分割任务，它利用了现有数据集中 2D 语义线索和粗糙 3D 标注信息的统一，实现了多视角一致的二维标签生成，可以提高多视角下的几何语义渲染准确性，消除粗糙 3D 标注的标签歧义和 2D 语义标注的噪声，与其他标签转移方法相比，在 KITTI-360 数据集的城市场景中，Panoptic NeRF 在准确度和多视角一致性方面表现更好。

Mar, 2022

Gear-NeRF：自由视点渲染和动态感知时空采样

Gear-NeRF 使用语义信息和动态对象追踪技术解决了 NeRF 模型在计算资源受限和场景语义理解方面的局限性，实现了逼真的动态场景渲染和新视角追踪。

Jun, 2024

基于语义感知的神经辐射场用于视觉场景理解：综述

本综述全面研究了语义感知的神经辐射场（NeRFs）在视觉场景理解中的作用，覆盖了 250 多篇学术论文的分析。它探讨了 NeRFs 在场景中熟练推断静态和动态物体的三维表示的能力，并介绍了其在生成高质量新视点、补全场景细节（修复）、进行全面场景分割（全景分割）、预测三维边界框、编辑三维场景和提取以物体为中心的三维模型方面的重要性。本研究的一个重要方面是将语义标签应用为视点不变函数，有效地将空间坐标映射到一系列语义标签的过程，从而便于识别场景中的不同物体。总体而言，本综述强调了在视觉场景解释的背景下，语义感知的神经辐射场的发展和多样应用。

Feb, 2024

基于神经渲染的无监督连续语义适应

本文研究了语义分割的连续多场景自适应问题，提出了基于 Semantic-NeRF 网络的解决方案，通过将分割模型的预测结果融合，使用视点一致的渲染语义标签来适应模型。我们在 ScanNet 数据集上测试，取得了比基线和最先进的无监督域自适应方法更好的性能。

Nov, 2022