Nov, 2022

AcceRL:深度强化学习策略加速框架

TL;DRAcceRL 是一种基于神经网络压缩的轻量级并行训练框架,它综合了多种神经网络压缩技术,用 Off-Policy 方法来优化经验,显著降低了传统方法的时间成本并保持了相同的策略质量。