关键词red teaming
搜索结果 - 14
  • 针对阿喀琉斯之踵的调查:生成模型的红队演练
    PDF3 months ago
  • 可解释人工智能用于高光谱图像分析的红队建模
    PDF4 months ago
  • AI 评估与红队行动的安全港湾
    PDF4 months ago
  • ICLR大型语言模型的好奇心驱动的红队扮演
    PDF4 months ago
  • ACL基于梯度的语言模型红队测试
    PDF5 months ago
  • 走向多模态多语种翻译的红色团队
    PDF5 months ago
  • 红队模拟可视化语言模型
    PDF5 months ago
  • ACL大规模语言模型的红队攻防:解决数学任务中的幻觉问题
    PDF6 months ago
  • 保障海上自治系统中人工智能的红队框架
    PDF7 months ago
  • 不以为意:从语言模型中引发冒犯
    PDF9 months ago
  • 从零开始进行红队攻防测试语言模型的探索、建立和利用
    PDFa year ago
  • 大型语言模型是否可以通过对抗方式改变用户偏好?
    PDFa year ago
  • 将红队化的语言模型减少危害:方法、扩展行为与经验教训
    PDF2 years ago
  • 使用语言模型对语言模型进行红队测试
    PDF2 years ago
Prev
Next