BriefGPT.xyz
大模型
Ask
alpha
关键词
ai alignment research
搜索结果 - 3
AI 的合理人标准
人工智能治理和人工智能对齐研究的一个挑战是以一种对社会有用和建设性的方式规范其行为,而合理人标准提供了对我们在模型中开发、测试和强调的行为类型的有用指导,并且解释了合理性在关键领域的定义和用法,以及合理行为的社会理解为 AI 研究人员提供了
→
PDF
a month ago
脑到机器的共情交流作为一种价值对齐策略
AI 对齐研究旨在保证机器的独立行为始终符合伦理,本文认为尽管常常被忽视,但共情对此任务而言是必要的,我们提出了一个从内而外的方法,通过将道德放置于脑的背景下作为算法理解伦理和共情的基础,通过对相关文献的调查,证明了这些论证,文章以建议未来
→
PDF
7 months ago
研究对齐研究:无监督分析
通过分析现有的 AI 对齐研究,我们发现领域正在迅速发展,并出现了几个子领域。我们查看了子领域并确定了突出的研究人员、经常出现的话题和每种不同的交流方式。此外,我们发现,一个分类器可以检测出 AI 对齐研究文章中没有最初包含在数据集中的相关
→
PDF
2 years ago
Prev
Next