BriefGPT.xyz
大模型
Ask
alpha
关键词
safety standards
搜索结果 - 3
AI 系统的身份识别
提出一个框架,在其中为 AI 系统的实例分配标识,并为寻求与该系统交互的各方提供相关信息。讨论了 AI 系统的标识、潜在需求、激励机制、实现方式以及限制和风险,并指出在高风险场景下更有必要使用标识。通过进一步研究,标识可以帮助管理人工智能系
→
PDF
17 days ago
ShieldLM: 强化 LLM 为一致、可定制和可解释的安全检测器
该研究提出了一种基于大型语言模型的安全检测器 ShieldLM,它遵循通用的人类安全标准,支持可定制的检测规则,并提供其决策的解释。通过在包括 14,387 个查询 - 响应对的大型双语数据集上进行训练,研究表明,ShieldLM 在四个测
→
PDF
4 months ago
前沿人工智能规管:管理新兴公共安全风险
前沿 AI 模型的安全性规范与公共安全风险需求有关。建立标准设置流程、注册报告需求以及合规机制是对前沿 AI 模型进行规范的必要步骤。产业自律是重要的第一步,但还需要社会广泛讨论和政府干预以确保规范的制定和遵循。将执法权力授予监管机构和颁发
→
PDF
a year ago
Prev
Next