BriefGPT.xyz
Ask
alpha
关键词
monte carlo augmented actor critic
搜索结果 - 1
蒙特卡罗增强演员 - 评论家算法处理来自次优演示的稀疏奖励深度强化学习
提供 RL 算法的稠密形状奖励函数往往非常具有挑战性,因此发展能够从易于指定的稀疏奖励函数中学习的 RL 算法已成为研究动机。为解决因奖励稀疏性而引入的新的探索挑战,我们引入了 Monte Carlo 增强 Actor Critic (MC
→
PDF
2 years ago
Prev
Next