关键词safety fine-tuning
搜索结果 - 3
  • 采用剩余流激活分析对大型语言模型进行防御
    PDFa month ago
  • MART:利用多轮自动红队测试提高 LLM 的安全性
    PDF8 months ago
  • BadLlama: 从 Llama 2-Chat 13B 中廉价移除安全微调
    PDF8 months ago
Prev
Next