AAAIDec, 2023

基于 Transformer 的流匹配中的潜变空间编辑

TL;DR通过流匹配和变压器(U-ViT)的结合,实现了简单高效的图像编辑方法,大大提高了生成模型的可扩展性和性能,并提供了对潜在结构和编辑能力的探索。通过引入一个名为 $u$-space 的编辑空间以及针对 ODE 求解器的适应性抽样解决方案,实现了可控、累积和可组合的图像编辑。此外,使用文本提示的简洁而强大的方法实现细粒度和细致的图像编辑。这个框架既简单高效,同时又能保留图像原始内容的本质。