Feb, 2024

恢复生成模型的预 Fine-Tuning 权重

TL;DR通过使用少量低秩(LoRA)微调模型,我们提出了一种名为 Spectral DeTuning 的方法,能够恢复出预微调模型的权重,利用这一新的漏洞攻击大规模模型。