BriefGPT.xyz
Ask
alpha
关键词
g-learning
搜索结果 - 1
通过软更新降低强化学习中的噪声
提出 G-learning 算法用于强化学习领域,该算法通过对决策策略进行惩罚,实现了对值函数估计的减少偏差,从而在学习过程的初期能够有更快的收敛速度并降低学习成本。
PDF
9 years ago
Prev
Next