BriefGPT.xyz
Ask
alpha
关键词
human moral reasoning
搜索结果 - 2
大型语言模型的道德基础
本文通过使用道德基础理论分析研究已知的大型语言模型,发现它们存在特定的道德偏见,并展示了这些偏见与人类道德基础和政治倾向之间的关系。此外,研究还衡量了这些偏见的一致性,并证明了通过不同上下文的选择性引导可以影响模型在后续任务中的行为,从而揭
→
PDF
9 months ago
反思式混合智能用于决策支持系统的意义人类控制
介绍自我反思人工智能系统的概念,提出了一个融合了心理学、哲学、形式推理方法和机器学习方法的框架,旨在创建响应人类价值和社会规范的人工智能系统,可以增加有意义的人类控制并通过提供人类道德盲点的可理解信息和见解来赋予人类道德推理的能力。
PDF
a year ago
Prev
Next