Dec, 2022

稳定的艺术家:在扩散潜空间中引导语义

TL;DR利用基于文本的生成式模型生成高保真度图像的表现十分引人注目。然而,通过微调输入来实现对图像的高度控制仍然有很大的挑战。为了解决这一问题,研究者提出了一种称为稳定艺术家的图像编辑方法,它利用语义引导来沿着语义方向控制扩散过程中的不同变量数量,从而实现对图像的微调。通过这种方法,可以灵活地调整图像的构图、样式和整体艺术概念,并深入了解模型所学概念的表现,包括复杂的概念,如 “碳排放”。研究结果表明,在多项任务中,该方法能实现高质量的图像编辑和构图。