BriefGPT.xyz
Ask
alpha
关键词
relearning attacks
搜索结果 - 1
有针对性的重学习攻击对未学习的模型进行记忆激活
机器不学习是一种减轻机器学习模型中训练数据不良记忆的有希望的方法。然而,在这项工作中,我们显示出现有的 LLMs 取消学习方法意外地容易受到一组简单有针对性的重新学习攻击的影响。通过仅访问少量可能松散相关的数据集,我们发现可以 “调整” 取
→
PDF
17 days ago
Prev
Next