Moab Arar, Andrey Voynov, Amir Hertz, Omri Avrahami, Shlomi Fruchter...
TL;DR使用单个提示进行对齐的个性化方法,改善文字对齐,实现与复杂和精细提示相关的图像创作。
Abstract
Content creators often aim to create personalized images using personal
subjects that go beyond the capabilities of conventional text-to-image models.
Additionally, they may want the resulting image to encompass
本文介绍了一种 Fine-Tuning 方法,使用人类反馈对齐文本到图像的 Deep generative model,通过分析设计选择平衡对齐 - 准确性的权衡,最终通过奖励加权似然优化,使得生成的对象更准确地反映了指定颜色、数量和背景等特征。结果表明,利用人类反馈可以显著改善文本到图像的 Deep generative model 的性能。