Jan, 2020

PoPS: 深度强化学习策略剪枝与收缩

TL;DR本文介绍了一种名为 Policy Pruning and Shrinking 的深度强化学习算法,该算法利用迁移学习,通过迭代策略剪枝和缩小方法,实现了对深度神经网络的压缩表示,在不牺牲性能的情况下减少了计算成本。实验证明其在几个常见的强化学习环境中具有很强的性能。