Mar, 2024

InstructGIE: 通向通用图像编辑的探索

TL;DR一个新的图像编辑框架,通过增强上下文学习能力和统一语言指导以提高泛化鲁棒性,利用 VMamba Block 和编辑偏移匹配策略来增强图像编辑任务的能力,并结合选择性区域匹配技术和语言统一技术来改善生成图像的质量,同时提供第一个利用视觉提示和编辑指导的图像编辑数据集来提高上下文能力。