BriefGPT.xyz
Ask
alpha
关键词
dynamic reward markov decision processes
搜索结果 - 1
ICML
与可变且可影响奖励函数保持 AI 对齐
现有的 AI 对齐方法假设偏好是静态的,这是不现实的:我们的偏好会改变,甚至可能受到与 AI 系统的交互的影响。为了阐明错误地假设偏好是静态的后果,我们引入了动态回报马尔可夫决策过程 (DR-MDPs),明确地模拟偏好变化和 AI 对其的影
→
PDF
a month ago
Prev
Next