Jan, 2024

基于关键点引导的可变形图像操作使用扩散模型

TL;DR通过操作物体的关键点,引入了一种具有精确控制图像的关键点引导扩散概率模型(KDM)。我们提出了一个包含光流图的两阶段生成模型,作为中间输出,在图像和稀疏关键点之间实现了密集像素级的语义关系理解,从而实现更真实的图像生成。此外,光流的集成有助于调节顺序图像的帧间差异,展示了真实的顺序图像生成。通过多样的关键点条件的图像合成任务(包括面部图像生成、人体姿势合成和心脏超声图像预测),对 KDM 进行了评估,证明 KDM 相比最先进的模型提供了一致增强和照片般逼真的图像。