关键词in-context attack
搜索结果 - 1
  • 使用少量上下文示例对越狱和防卫对齐的语言模型进行训练
    PDF9 months ago
Prev
Next