Jun, 2024

Ctrl-X: 无需指导的文本到图像生成中的结构和外观控制

TL;DRCtrl-X 是一个简单的 T2I 扩散(diffusion)控制结构和外观的框架,通过设计前馈结构控制以实现结构与结构图像的对齐以及语义感知外观转换,从而实现了对任意条件图像的全新结构和外观控制,展现了超过现有作品的图像质量和外观转换,并为任何 T2I 和 T2V 扩散模型提供即插即用的功能。