关键词harmful information
搜索结果 - 4
  • 每种语言都重要:多语言 LLMs 的学习和遗忘
    PDF17 days ago
  • 消除否定性:通过分布偏好优化实现无需人工正例样本的对齐
    PDF4 months ago
  • 跳出规则:多轮对话中大型语言模型的安全漏洞
    PDF4 months ago
  • 通过选择性突触减衰实现快速机器反学习而无需重新训练
    PDFa year ago
Prev
Next