BriefGPT.xyz
Ask
alpha
关键词
safe inputs but unsafe output
搜索结果 - 1
跨模态安全对齐
人工通用智能(AGI)越来越多地融入到人类生活的各个方面,确保这些系统的安全和道德一致性至关重要。过去的研究主要关注单模态威胁,这可能不足以应对交叉模态相互作用的综合和复杂性。我们提出了一个名为 “安全输入但不安全输出(SIUO)” 的新型
→
PDF
15 days ago
Prev
Next