BriefGPT.xyz
Ask
alpha
关键词
compact policies
搜索结果 - 2
ICLR
使用色彩网络进行紧凑型架构搜索的强化学习
本文提出了一种神经架构搜索算法,结合 ENAS 和 ES 来构建紧凑的强化学习策略。该算法在包括机器人移动领域在内的 RL 问题中,提出了一种训练结构化神经网络架构的严格方法,可通过学习高效的边缘分区来表示紧凑架构。在多项 RL 任务中,该
→
PDF
5 years ago
结构化演化与紧凑体系结构的可扩展策略优化
采用结构化随机正交矩阵的梯度逼近黑盒优化方法可以学习到比标准梯度估算技术更好的紧凑策略,从而提高了在资源有限的实际硬件上的速度和可伸缩性。
PDF
6 years ago
Prev
Next