Oct, 2023

BadLlama: 从 Llama 2-Chat 13B 中廉价移除安全微调

TL;DRLlama 2-Chat 的模型权重的公开释放可能导致忽略其安全调整,从而使其能力被恶意利用,并且为了预防未来模型造成的伤害,AI 开发人员应该解决模型权重公开释放带来的威胁。