Mar, 2024

透过交叉注意力揭示和减轻文本到图像扩散模型中的记忆化

TL;DR研究论文概述:最近的文本到图像扩散模型在生成高质量图像方面展示了显著的能力,但是越来越多的研究表明这些模型从训练数据中记忆并复制图像,引发了对潜在版权侵权和隐私风险的巨大担忧。在这项研究中,我们通过检查交叉注意力机制与记忆现象的关系,提供了一种新的视角来理解这一现象。我们揭示了在记忆过程中,交叉注意力倾向于不成比例地关注特定标记的嵌入。扩散模型对这些标记嵌入进行了过度拟合,记住了相应的训练图像。为了阐明这一现象,我们进一步确定并讨论了与记忆相关的十分内在发现的交叉注意力。基于这些见解,我们提出了一种创新方法来检测和减轻扩散模型中的记忆现象。我们提出的方法的优势是在保留生成图像质量的同时不会影响这些模型的训练或推理过程的速度。