May, 2022

深度强化学习中的表征差距

TL;DR本文介绍了如何通过 POPRO 方法,解决深度强化学习中的表示重叠问题,提高策略学习的效果。