Nov, 2017

人工智能安全的网格世界

TL;DR该研究提出了一系列强化学习环境,说明智能代理的各种安全属性问题。我们通过为每个环境配备一个隐藏的性能函数来衡量与预期安全行为的一致性,该研究将 AI 安全问题分为强健性问题和规范问题。我们在这些环境中评估了两种深度强化学习代理 A2C 和 Rainbow,并展示了它们不能令人满意地解决这些问题。