May, 2024

RefDrop: 基于参考特征引导的图像或视频生成中的可控行一致性

TL;DR通过操作注意力模块,而不需要微调,我们揭示了一种将图像自我注意力和合成内容和参考特征之间的交叉注意力进行线性插值的流行方法的机制,并提出了一种简化的可控生成机制,名为 RefDrop,它能够直接而精确地控制参考上下文的影响,提高图像生成和视频生成的一致性并允许更多有趣的应用。