Dec, 2019

信息论模型预测 Q 学习

TL;DR本研究提出了一种基于信息理论模型预测控制和熵正则化强化学习的 Q 学习算法,可以利用有偏模型,并在模拟控制任务中验证了该算法的有效性。