Dec, 2022

Imagen Editor 和 EditBench:推进和评估文本引导的图像修补

TL;DR本文提出了一种基于文本指导的图像编辑系统 Imagen Editor,通过利用对象检测器提出文本提示的修复遮罩并使用高分辨率图像来处理细节来实现忠实于输入文本且与输入图像一致的编辑,并提出一个名为 EditBench 的系统化基准来评估编辑效果。研究发现在训练过程中进行对象遮罩处理,可以显著提高文本与图像的对齐度和整体渲染效果,同时相较于文本渲染而言,这种方法在物体渲染和处理材料 / 颜色 / 大小属性上效果更佳。