May, 2024

多主题个性化

TL;DR创意故事插图需要多个字符或对象的一致互动,然而传统的文本到图像模型在生成具有多个个性化主题的图像时面临挑战,如主题渲染失真或文本描述无法呈现一致的主题互动。我们提出了多主题个性化(MSP)以减轻其中的一些挑战,通过使用稳定扩散实现 MSP,并将其与其他文本到图像模型进行评估,展示了其一致生成代表预期主题和互动的高质量图像。