ICMLNov, 2018

熵对策略优化的影响理解

TL;DR本文研究了使用熵正则化提高强化学习策略优化的方法,探讨了高熵策略能使得优化过程更为平滑,从而帮助穿过局部优化点,但挑战在于设计通用的策略优化算法。