多视角图像编辑的注意力特征整合

Feb, 2024

多视角图像编辑的注意力特征整合

Consolidating Attention Features for Multi-view Image Editing

Or Patashnik, Rinon Gal, Daniel Cohen-Or, Jun-Yan Zhu, Fernando De la Torre

TL;DR通过在多视图编辑过程中引入一种新的方法，QNeRF，来提高编辑图像的几何一致性和多视图一致性。

Abstract

large-scale text-to-image models enable a wide range of image editing techniques, using text prompts or even spatial controls. However, applying these editing methods to multi-view images depicting a single scene leads to 3D-inconsistent results. In this work, we focus on spatial contr

large-scale text-to-image models spatial control-based geometric manipulations consistency qnerf multi-view consistency

发现论文，激发创造

ViCA-NeRF：视角一致性感知的神经辐射场的 3D 编辑

ViCA-NeRF 是第一个运用文本指令进行三维编辑且具备视图一致性的方法，通过利用几何规则和学习规则来确保多视图一致性，提供更灵活、高效且更详细的编辑效果。

Feb, 2024

可编辑的小说视角合成的统一分解和组合 NeRF 学习

本论文提出了一个统一的神经辐射场（NeRF）框架，以有效地进行场景分解和合成，用于建模现实世界场景，通过学习不同对象的解耦 3D 表示进行场景编辑，同时为新颖视角合成建模整个场景表示。

Aug, 2023

DATENeRF: 基于深度的文本编辑技术

利用拓展到神经辐射场（NeRF）的编辑技术来编辑场景是复杂的，本文提出了利用 NeRF 场景的几何信息作为桥梁来整合 2D 编辑的方法，并引入了一种填充方法来确保对不同图像的 2D 编辑具有鲁棒性。结果表明，该方法比现有的文本驱动 NeRF 场景编辑方法实现了更加一致、逼真和详细的编辑效果。

Apr, 2024

通过 CLIP 知识的三维蒸馏进行本地三维编辑

本文提出了一种名为 Local Editing NeRF（LENeRF）的方法，可以通过文本输入进行精细和本地化的 3D 内容操作，其中利用了三种 add-on 模块：潜在残差映射器、注意场网络和变形网络，通过估算 3D 注意场来实现 3D 特征的局部操作。

Jun, 2023

通过特征场蒸馏分解 NeRF 以进行编辑

本文提出通过蒸馏出自监督的 2D 图像特征提取器的知识，优化一种针对 NeRF 的 3D 特征场，从而实现语义场景分解以及针对局部区域的查询式编辑，从而实现结构编辑的目的。通过实验证明，3D 特征场可以将最近在 2D 视觉和语言基础模型中取得的进展应用于 3D 场景表示，从而实现令人信服的 3D 分割和选择性编辑。

May, 2022

NeRF 注意力机制的端到端视图合成

本文提出了一种基于 NeRFA 的 seq2seq 形式，用于视图合成，在四个数据集上优于 NeRF 和 NerFormer，并在单场景视角合成和类别中心的新视图合成两个方面取得了最新技术成果。

Jul, 2022

3D-SceneDreamer: 文本驱动的 3D 一致场景生成

利用文本驱动的 3D 场景生成技术，在构建 3D 场景时通过使用现有的生成模型进行图像变形和修复，同时结合查询和聚合全局 3D 信息来生成高质量的新内容，并在支持多种场景生成和任意相机路径的同时改善视觉效果和 3D 一致性。

Mar, 2024

基于组合神经辐射场的语义三维感知人像合成与操作

通过分割语义区域并利用神经辐射场学习各自的辐射场，最后合并成完整图像，CNeRF 方法可以实现细粒度的语义区域操作，同时维持高质量的 3D 一致合成。

Feb, 2023

单输入图像视角合成的视觉 Transformer 网络

本研究提出利用全局和局部特征构建表达式三维模型的方法，通过训练 MLP 网络，实现从单个未定位图像中合成新视角，并在多个物体类别上进行泛化，获得了比现有方法更出色的性能和更丰富的细节渲染。

Jul, 2022

Blended-NeRF: 在现有的神经辐射场中生成和混合零样本目标

Blended-NeRF 是一种基于文本提示或图像贴片及 3D ROI 盒子的方法，利用预训练的语言 - 图像模型来操纵合成并混合一个新对象到现有的 NeRF 场景中实现对现有场景感兴趣区域的编辑，使用新颖的容积混合技术进行无痕混合。

Jun, 2023