CVPRJan, 2021

GST:组稀疏训练以加速深度强化学习

TL;DR为了加速深度强化学习在实际边缘设备中的运行,本文提出了一种基于分块循环压缩的权重压缩方法,名为组稀疏训练 (GST),该方法在所有深度强化学习迭代中选择性地使用分块循环压缩,并通过奖励感知修剪动态地调整目标稀疏度,以实现稳定的训练,实验表明该方法在 Mujoco Halfcheetah-v2 和 Mujoco humanoid-v2 环境下的 TD3 训练中,平均压缩比比迭代修剪方法高 25% p-41.5% p,而且没有奖励降低。