May, 2024

扩散模型中的强鲁棒概念擦除修剪

TL;DR通过选择性修剪与要移除的概念相关的关键参数,改进了概念擦除技术的稳健性,并通过抵抗对抗性输入的实验结果证明了显著改进