NIPSNov, 2018

重要性加权演化策略

TL;DR本研究提出改进新型的进化策略算法 - 重要性加权进化策略(IW-ES),通过重要性采样技术来解决现有进化策略算法数据效率较低的问题,在保持原始方法的可扩展性的同时,可以在每个经验批次上执行多个更新,为高效生成强化学习策略算法提供了新思路。