MMJan, 2020

反馈放松控制的规律性与稳定性

TL;DR本文提出了一种基于松弛控制正则化和一般探索奖励的鲁棒反馈控制方法,针对多维连续随机离散时间问题,提出了一种实现鲁棒决策的强化学习启发式方法,该方法表现出强大的鲁棒性,并在参数扰动下稳定可靠。