BriefGPT.xyz
Ask
alpha
关键词
ai risk
搜索结果 - 2
陈述性事实对 LLMs 推理能力的影响
通过测试影响大型语言模型预测的抽象声明,我们发现即使它们与程序性信息冲突,抽象声明仍然会影响模型的预测结果。这些结果在多个领域中都是一致的,并且与模型规模的增大关系不大。我们认为这些结果对 AI 风险 (与 “叛变点” 相关) 和公平性具有
→
PDF
7 months ago
探讨高水平人工智能的差异化风险和控制问题
本文使用分层复杂系统框架对人工智能(AI)风险进行建模,并从公共和私营领域的领域专家收集调查数据以分类 AI 影响和可能性,结果显示强大的 AI 代理情景有更多不确定性,对 AI 对齐失败和影响寻求行为的关注增加以及对多智能体环境的信心增强
→
PDF
2 years ago
Prev
Next