Oct, 2023

在文本图像生成模型中定位和编辑知识

TL;DR文本到图像扩散模型研究了知识表示和视觉特征,采用因果中介分析方法来理解大规模文本到图像扩散模型中不同视觉属性相关的知识是如何存储的,并发现在条件 UNet 的一组组件中分布着不同属性的知识。同时,发现在公共文本到图像模型中,只存在一个因果状态,这在其他语言模型中是不同的。基于这种观察,引入了一种快速、无需数据的模型编辑方法 Diff-QuickFix,可以在短时间内编辑(删除)模型中的概念,提供了 1000 倍的加速和与现有微调方法相当的编辑性能。