BriefGPT.xyz
Ask
alpha
关键词
sparse-reward goal-conditioned tasks
搜索结果 - 1
高回放比与规则化的高效稀疏奖励目标条件式强化学习
纵观文中,研究主要集中在强化学习方法中如何将高重放比率(RR)与正则化相结合,以推进稀疏奖励目标条件任务并提高样本效率。作者对 Randomized Ensemble Double Q-learning 方法进行了修改并应用于稀疏奖励目标条
→
PDF
7 months ago
Prev
Next