Jan, 2024

基于扩散的刚体与非刚体编辑方法及其在文本和图像导向下的统一应用

TL;DR该研究提出了一种多功能图像编辑框架,可以执行刚性和非刚性编辑,并通过文本提示或参考图像进行引导。通过应用双路径注入方案来处理各种编辑场景,并引入了整合的自注意机制来融合外观和结构信息。综合实验证明了该方法的有效性,在基于文本的编辑和外观转换任务中取得了竞争性或优越的结果,适用于刚性和非刚性设置。