Jun, 2022

形式化副作用约束问题

TL;DR我们提出了一个通过协助博弈框架来规范 AI 副作用的正式标准,通过权衡 “制造多大混乱” 与代理目标的代理目标来解决部分可观察马尔可夫决策过程(POMDP)表示的不确定性问题。我们展示了通过在两个格网环境中使用 ground-truth 评估来证明我们问题形式化的合理性。