Oct, 2022

UniTune: 通过微调图像生成模型对单个图像进行文本驱动的图像编辑

TL;DRUniTune 是一种简单而新颖的文本驱动图像编辑方法,它使用文本作为直观的艺术指导界面并且无需其他输入。该方法的核心在于观察到,通过选择合适的参数,我们可以在单个图像上对大型文本到图像扩散模型进行微调,从而鼓励模型保持对输入图像的忠实性,同时允许表达性的操作。该文献中,作者使用 Imagen 作为他们的文本到图像模型,并证明了 UniTune 方法的广泛适用性。