May, 2024

M^2DNeRF:带有 3D 特征域的多模态分解 NeRF

TL;DR多模态分解 NeRF(${M^2D}$NeRF)是一种能够进行文本和视觉补丁编辑的单一模型,通过使用多模态特征蒸馏来整合来自预训练视觉和语言模型的教师特征到三维语义特征体积,从而促进一致的三维编辑。实验证明,在三维场景分解任务中,相较于以前的基于 NeRF 的方法具有更优异的性能。