Jan, 2024

TIP-Editor: 一个基于文本和图片提示的准确3D编辑器

TL;DRTIPEditor是一个接受文本和图像提示以及3D边界框来规定编辑区域的3D场景编辑框架,通过使用图像提示用户可以方便地指定目标内容的详细外观或样式,实现准确控制;TIPEditor在现有场景和参考图像的表示之间采用逐步的2D个性化策略来更好地学习,通过定位损失鼓励正确的对象布局;此外,TIPEditor利用显式和灵活的3D高斯重建作为3D表示,以便进行局部编辑而保持背景不变。广泛的实验证明,TIP-Editor能够按照文本和图像提示在指定的边界框区域进行准确的编辑,无论从编辑质量还是与提示的对齐程度来看,在定性和定量方面都优于基线模型。