GP-NeRF:通用感知 NeRF 用于上下文感知 3D 场景理解
使用多视图输入合成新视图图像,神经辐射场(NeRF)已成为三维视觉中的热门研究课题。本文提出了一种具有一般化语义神经辐射场(GSNeRF)的方法,该方法独特地将图像语义纳入合成过程中,从而能够对未见场景生成新视图图像和相关的语义地图。我们的 GSNeRF 由两个阶段组成:语义地理推理和深度引导的视觉渲染。前者能够从场景中观察多视图图像输入,提取语义和几何特征。在后者的指导下,利用得到的图像几何信息,进行图像和语义渲染,从而提高性能。我们的实验证实了 GSNeRF 在新视图图像和语义分割合成方面优于先前的工作,并进一步验证了我们的采样策略的有效性。
Mar, 2024
优化 Semantic-NeRF 模型以实现仅有语义输出,并移除 RGB 输出成分,通过对比实验证明这种改动对于场景理解、目标检测和分割等任务的影响,提供了渲染场景的新方式并促进了进一步的研究和发展。
Mar, 2024
本研究提出了一种基于神经辐射场的高保真度自由视点下人体合成的通用且高效的管道,其中利用几何引导的多视点特征整合方法和渐进式渲染管道通过提供完整的几何体积和预测的密度值来显著提高多个泛化设置下的综合性能和渲染效率。
Dec, 2021
通过利用场景语义先验,加快训练速度和提高渲染效果,本文改进了 NeRF-based 模型,在特定目标上进行快速训练,并且对所有 NeRF-based 模型都适用。此外,通过稀疏采样负射线样本并研究弱监督方法,进一步加速训练并保持渲染质量。最后,通过扩展像素语义和颜色渲染公式,提出了一种新的场景编辑技术,以实现特定语义目标的独特显示或在渲染中进行掩盖。同时,通过结合形态学运算和聚类,设计了自监督循环来解决场景中无监督区域的不正确推断问题。
Aug, 2023
本研究提出了一种新的 3D 到 2D 标签转换方法 - Panoptic NeRF 用于语义分割和实例分割任务,它利用了现有数据集中 2D 语义线索和粗糙 3D 标注信息的统一,实现了多视角一致的二维标签生成,可以提高多视角下的几何语义渲染准确性,消除粗糙 3D 标注的标签歧义和 2D 语义标注的噪声,与其他标签转移方法相比,在 KITTI-360 数据集的城市场景中,Panoptic NeRF 在准确度和多视角一致性方面表现更好。
Mar, 2022
Gear-NeRF 使用语义信息和动态对象追踪技术解决了 NeRF 模型在计算资源受限和场景语义理解方面的局限性,实现了逼真的动态场景渲染和新视角追踪。
Jun, 2024
本综述全面研究了语义感知的神经辐射场(NeRFs)在视觉场景理解中的作用,覆盖了 250 多篇学术论文的分析。它探讨了 NeRFs 在场景中熟练推断静态和动态物体的三维表示的能力,并介绍了其在生成高质量新视点、补全场景细节(修复)、进行全面场景分割(全景分割)、预测三维边界框、编辑三维场景和提取以物体为中心的三维模型方面的重要性。本研究的一个重要方面是将语义标签应用为视点不变函数,有效地将空间坐标映射到一系列语义标签的过程,从而便于识别场景中的不同物体。总体而言,本综述强调了在视觉场景解释的背景下,语义感知的神经辐射场的发展和多样应用。
Feb, 2024
本文研究了语义分割的连续多场景自适应问题,提出了基于 Semantic-NeRF 网络的解决方案,通过将分割模型的预测结果融合,使用视点一致的渲染语义标签来适应模型。我们在 ScanNet 数据集上测试,取得了比基线和最先进的无监督域自适应方法更好的性能。
Nov, 2022