Mar, 2024

文本到图像扩散模型中的大规模概念编辑

TL;DR我们提出了一种名为 EMCID 的两阶段方法,用于在大规模实际场景中同时解决文本到图像扩散模型生成过时、受版权限制、错误和带有偏见的内容的问题。通过对每个个体概念进行双自对齐损失和扩散噪声预测损失的记忆优化,第一阶段实现了内存优化;第二阶段通过多层闭合模型编辑进行大规模概念编辑。我们还提出了一个名为 ImageNet Concept Editing Benchmark(ICEB)的全面评估基准,用于评估 T2I 模型的大规模概念编辑,包括自由形式提示、大规模概念类别和广泛的评估指标。在我们提出的基准和之前的基准上进行的大量实验表明,EMCID 具有卓越的可扩展性,可以编辑多达 1000 个概念,为在实际应用中快速调整和重新部署 T2I 扩散模型提供了实用方法。