BriefGPT.xyz
Ask
alpha
关键词
preference change
搜索结果 - 2
ICML
与可变且可影响奖励函数保持 AI 对齐
现有的 AI 对齐方法假设偏好是静态的,这是不现实的:我们的偏好会改变,甚至可能受到与 AI 系统的交互的影响。为了阐明错误地假设偏好是静态的后果,我们引入了动态回报马尔可夫决策过程 (DR-MDPs),明确地模拟偏好变化和 AI 对其的影
→
PDF
a month ago
AAAI
认识到偏好变化的重要性:呼吁在人工智能时代进行协调的跨学科研究努力
本文提出成立跨学科组织,聚焦于理解 AI 系统对个体决策偏好的影响,运用各学科概念对偏好进行操作化,提出偏好变化的框架,并明确了可接受的和不可接受的变化。
PDF
2 years ago
Prev
Next