Feb, 2024

无需训练的一致文本图像生成

TL;DRConsiStory 是一种无需训练的方法,通过共享预训练模型的内部激活来实现一致的主题生成,同时采用基于主题的共享注意力块和基于对应关系的特征注入来促进图像之间的一致性。通过与各种基线对比,我们展示了 ConsiStory 在主题一致性和文本对齐方面的最先进性能,而无需进行任何优化步骤。最后,ConsiStory 可以自然地扩展到多主题场景,甚至可以对常见物体进行无需训练的个性化。