Aug, 2023

小心行动:通过文本指令进行本地图像和场景编辑

TL;DR我们提出了一种方法来定位文本指令中所隐含的期望编辑区域,并利用 InstructPix2Pix(IP2P)来确定在有和无指令的情况下 IP2P 预测之间的差异,以此差异作为相关性地图。相关性地图传达了每个像素更改的重要性,并用于指导修改,以确保不相关的像素保持不变。相关性地图进一步用于增强以神经辐射场形式的文本引导下 3D 场景的编辑质量。我们的方法在图像和 NeRF 编辑任务上实现了最先进的性能。