May, 2022

使用实际因果的道德强化学习

TL;DR提出了一种基于因果道德的在线强化学习方法,并给出了应用该方法解决道德困境的案例,该方法可以使代理程序在学习决策时考虑是否造成伤害,更好地符合我们的道德判断。