BriefGPT.xyz
Ask
alpha
关键词
disdiff
搜索结果 - 1
扰乱传播:基于令牌级别的注意力删除攻击针对基于传播的定制化
本文提出了 DisDiff(Disrupting Diffusion),一种破坏扩散模型输出的新型对抗攻击方法。通过运用 Cross-Attention Erasure 模块来显式 “擦除” 指示的注意力图,并分析扩散模型的采样过程对 PG
→
PDF
a month ago
Prev
Next