BriefGPT.xyz
Ask
alpha
关键词
absolute learning progress
搜索结果 - 2
自定学习进度作为规则化学习课程的方法
通过自带课程学习和基于自适应学习的绝对学习进度正则化方法,加速强化学习的计算,提高其效率。
PDF
a year ago
连续参数环境下深度强化学习课程学习的教师算法
本研究探讨如何使用教师算法使得未知的深度强化学习算法的学习在不同的环境中变得能够拓展。研究表明,教师算法可以通过学习生成一系列逐步采样的参数来控制生成的随机过程环境,使其最终有效地提高学生的知识水平。通过建立连续赌博问题的代理模型,我们提出
→
PDF
5 years ago
Prev
Next