Jun, 2024

InstructRL4Pix:通过强化学习训练图像编辑的扩散

TL;DR通过使用增强学习引导图像编辑方法(InstructRL4Pix)来生成由目标对象的注意力地图引导的图像扩散模型,该方法通过计算注意力地图之间的距离作为奖励函数来最大化奖励模型的输出,并使用邻近策略优化(PPO)对扩散模型进行微调,以实现基于自然人命令的准确图像编辑。实验证实 InstructRL4Pix 突破了传统数据集的限制,利用无监督学习来优化编辑目标,并实现了精确的图像编辑。