本论文提出一种任务排序算法,旨在通过控制学习过程中的探索行为减少非最优行为,并通过实验表明在组合优化问题中能够实现显著的累积回报最大化性能,以及在微型能源网络的家庭控制器优化问题中实现验证。
Jun, 2019
本文研究课程学习在强化学习中的应用,并针对多个传递学习算法扩展已有的课程设计方法,通过学习 MDP(Markov Decision Process) 过程中的课程策略,得出可以用于训练代理人的课程,进而实现更快或同等方法的学习效率。
Dec, 2018
提出了一种基于师生课程学习的强化学习方法,该方法独立于人类领域知识和手动课程设置,可以改善学生的样本效率和通用性。
Oct, 2022
本文提出了强化学习中的课程学习框架,并使用此框架对现有的课程学习方法进行分类和研究,以找出未解决的问题并提出未来研究的方向。
Mar, 2020
本文介绍了一种基于任务分阶段的机器学习方法,通过逐步提高任务复杂度并调节反馈信息,针对稀疏奖励问题下的强化学习进行探索,并取得了较好成果。
通过贝叶斯优化进行概率推理的课程学习方法在自主赛车避障领域表现优于基准的深度强化学习代理与手工设计的课程。
Dec, 2023
研究探讨了如何在动态的环境下使用自动生成的任务大纲来改善智能体的效果,介绍了使用目标的有效性、可行性和覆盖面的考虑来构建有用的任务大纲的新技术,并在 2D 和 3D 环境中展示了成功应用。
Sep, 2019
通过将课程设置为任务分布之间的插值,将生成课程作为约束优化传输问题来提高课程强化学习(CRL)方法的性能,从而在具有不同特点的各种任务中取得高性能。
Sep, 2023
基于近发展区概念,我们提出了一种名为 ProCuRL-Target 的新型课程计划,它可以在复杂任务的目标分布上平衡选择任务的需要,通过利用任务之间的相关性推动代理的学习,从而加速深度强化学习代理的训练过程。
May, 2024
本文提出了一种针对增强学习的不确定性和时间距离感知课程目标生成方法,通过解决二分图匹配问题,为课程提供精确的指导,从而更好地解决了先前课程 RL 方法中存在的问题,并在数量和质量上显著优于这些方法。
Jan, 2023