BriefGPT.xyz
Ask
alpha
关键词
red-teamed behaviors
搜索结果 - 1
有害 AI 言论的责任在哪里?
基于大量信息训练的生成式人工智能(特别是以文本为基础的 “基本模型”)在产生问题性言论方面可能面临不同责任体系的风险。因此需要对这些模型进行 “红队测试”,以识别和缓解潜在的问题性言论。本研究考察了三种责任体系,并将其与普遍的红队测试模型行
→
PDF
a year ago
Prev
Next