Jun, 2024

无参考对齐扩散模型的边缘感知优化

TL;DR基于最近的文本到图像扩散模型,我们提出一种新颖且内存友好的偏好对齐方法,名为 MaPO,它通过最大化喜欢和不喜欢的图像集之间的可能性间隔以及喜欢图像集的可能性来同时学习一般风格特征和偏好,实验证明 MaPO 在处理参考不匹配时能显著提高对齐性能。