BriefGPT.xyz
大模型
Ask
alpha
关键词
deep sarsa
搜索结果 - 1
在线元学习之并行算法竞赛
该研究提出了一种名为 OMPAC 的在线元学习算法用于调整强化学习算法中关键的元参数以提高效率,实验证明,该方法可以在 Atari 2600 视频游戏和 Tetris 的问题上实现优越的性能。
PDF
7 years ago
Prev
Next