BriefGPT.xyz
Ask
alpha
关键词
teacher algorithm
搜索结果 - 1
连续参数环境下深度强化学习课程学习的教师算法
本研究探讨如何使用教师算法使得未知的深度强化学习算法的学习在不同的环境中变得能够拓展。研究表明,教师算法可以通过学习生成一系列逐步采样的参数来控制生成的随机过程环境,使其最终有效地提高学生的知识水平。通过建立连续赌博问题的代理模型,我们提出
→
PDF
5 years ago
Prev
Next