Apr, 2018
结构化演化与紧凑体系结构的可扩展策略优化
Structured Evolution with Compact Architectures for Scalable Policy Optimization
Krzysztof Choromanski, Mark Rowland, Vikas Sindhwani, Richard E. Turner, Adrian Weller
TL;DR采用结构化随机正交矩阵的梯度逼近黑盒优化方法可以学习到比标准梯度估算技术更好的紧凑策略,从而提高了在资源有限的实际硬件上的速度和可伸缩性。