Jun, 2024

AlignIT: 提升文本图像模型自定义中的提示对齐

TL;DR我们提出了一种新的后处理算法 AlignIT,该算法将感兴趣的概念的键和值与输入提示中的所有其他标记的键和值保持不变,从而解决了现有方法存在的问题,并显著提高了与输入提示的对齐性能。