- 无需重新训练的基于文本的 3D 场景编辑
我们引入了一种名为 DN2N 的文本驱动编辑方法,使用现成的基于文本的图像编辑模型修改 3D 场景图片,并提出了一种去除噪声扰动的训练数据生成方法,以及交叉视图正则化项来帮助泛化 NeRF 模型,实现了友好、直观和实用的用户编辑体验,并实现 - 使用 DDPM 反演和语义指导的实际图像编辑 LEDITS
LEDITS 是一种轻量级的图像编辑方法,结合了 Edit Friendly DDPM 反演技术和语义引导,能够实现对真实图像的细微和广泛编辑,而无需优化和扩展架构。
- DreamEditor: 使用神经场进行文本驱动的 3D 场景编辑
本文提出了 DreamEditor,一种使用文本提示对神经场进行编辑的新框架,用于场景重建,可以实现精确编辑神经场保持平滑的几何纹理,并且在定量和定性评估中明显超过以前的工作。
- Blended-NeRF: 在现有的神经辐射场中生成和混合零样本目标
Blended-NeRF 是一种基于文本提示或图像贴片及 3D ROI 盒子的方法,利用预训练的语言 - 图像模型来操纵合成并混合一个新对象到现有的 NeRF 场景中实现对现有场景感兴趣区域的编辑,使用新颖的容积混合技术进行无痕混合。
- 交互式文本摘要编辑
通过 REVISE 框架,将神经网络模型及人工编辑相结合,使得文本摘要的过程个性化,协作化和自适应化。
- 应用 Steering StyleGAN 进行任何图像反演和编辑
我们提出了一种名为 make it so 的新型 GAN 倒置方法,可以在噪声空间中操作,保留编辑功能,优于现有方法并实现更高质量的编辑效果。
- CVPR多模态人脸生成与编辑的协同扩散
本文提出了一种名为 Collaborative Diffusion 的模型,在不需要重新训练的情况下,利用多种单一模态扩展固有的单一模态扩散模型以实现多模态人脸生成和编辑。
- UPGPT: 人物图像生成、编辑和姿态转移的通用扩散模型
提出了一种统一的扩散模型 UPGPT,以实现所有人物图像任务 —— 生成,姿势转移和编辑,具有精细的多模态和分离能力,无需信号分割掩模即可对图像的生成和编辑过程进行精细控制。同时,在姿势引导人物图像生成方面,率先采用了参数化身体 SMPL - 基于语言模型的知识图谱嵌入编辑
本研究提出了一种新的任务,即在不影响其余表现的情况下编辑语言模型 KG 基础嵌入,并构建了四个新数据集来评估多个知识编辑基线和一种名为 KGEditor 的新方法,其利用超级网络的其他参数层来编辑和添加事实,实验结果表明 KGEditor - CVPR针对 GAN 反演和编辑的空间自适应多层选择
本研究提出了一种新的方法,可以在 GAN 的潜在空间中反演和编辑具有复杂场景布局和物体遮挡的图像,采用分层集合反演的思路,通过预测图像不同部分的可反转性,并将每个部分投影到潜在层中,系统学习将相对容易的区域反演到生成器的较早潜在空间,而将较 - InCoder:用于代码填充和合成的生成模型
通过左到右生成和插值,InCoder 可以执行程序合成并编辑的任务。它是第一个可以直接执行零样本代码插值的生成模型,并在类型推断、注释生成和变量重命名等方面显示出优秀的性能。
- ACL使用非自回归模型的文本编辑模仿学习课程
提出了一个框架以训练非自回归序列到序列模型进行编辑任务,在此过程中,原始输入序列被迭代地编辑以生成输出。通过两种策略解决了在机器翻译训练的模仿学习算法在编辑场景下导致的训练和推断之间不匹配问题,从而显著提高了英文编辑任务上的输出质量和输出复 - CVPR可靠的少样本图像生成的属性组编辑
本研究提出了一种新的基于属性组编辑方法的少样本图像生成技术,通过对属性进行编辑,该方法可以生成更为逼真和多样的图像,并具有可解释的全局属性方向性。
- CVPR图像倒置和编辑的风格变换器
本文介绍了一种基于 Transformer 的图像逆转和编辑模型,用于预先训练过的 StyleGAN,通过 CNN 编码器在多个尺度上提供图像特征作为键和值,并将样式代码视为查询,以在生成器中反转输入。无论是在逆转还是编辑任务中,该方法在 - 通过部件感知生成编辑隐式形状的 SPAGHETTI
介绍了一种名为 SPAGHETTI 的隐式形状编辑方法,通过将形状部分表征分为内在和外在几何信息,以及生成具有部分级别控制能力的框架,使得可以通过转换、插值和组合形状段来对隐式形状进行操作,并使用交互式图形界面演示了 SPAGHETTI 的 - AAAI序列复制编辑
本文针对神经序列到序列模型不能完全符合文本和代码编辑需求,提出了一种扩展模型,通过一次性在输出中复制整个输入来减少决策次数,并衍生一种新的训练目标和变种 beam search 算法来处理输出生成的多样性问题,在自然语言和源代码的一系列编辑 - 上下文感知原型编辑的响应生成
本文提出了一种响应生成的新范 Paradigm,通过编辑现有的原型响应,显著增加了生成结果的多样性和信息量,提出了一种响应编辑模型,实验结果表明,该模型在各个方面都优于传统的生成和检索模型。