Feb, 2017

在线元学习之并行算法竞赛

TL;DR该研究提出了一种名为 OMPAC 的在线元学习算法用于调整强化学习算法中关键的元参数以提高效率,实验证明,该方法可以在 Atari 2600 视频游戏和 Tetris 的问题上实现优越的性能。