Sep, 2021

MEPG:深度强化学习的极简集成策略梯度框架

TL;DR本文提出了一种新的深度强化学习框架 MEPG,它利用修改的 dropout 操作符将多个模型集成成单一模型来解决集成学习中的资源消耗问题,MEPG 通过保持 Bellman 方程两侧的 dropout 一致性来保持集成属性,实验结果表明 MEPG 方法在 gym 仿真器上的表现优于最先进的集成方法和无模型方法,且不会增加额外的计算资源成本。