本文研究课程学习在强化学习中的应用,并针对多个传递学习算法扩展已有的课程设计方法,通过学习MDP(Markov Decision Process)过程中的课程策略,得出可以用于训练代理人的课程,进而实现更快或同等方法的学习效率。
Dec, 2018
本文研究了如何通过选择不同目标函数,使用课程学习在强化学习中优化任务序列,提高初始性能,减少探索过程中的次优动作,并发现更好的策略。
Jan, 2019
本文介绍了自动课程学习(ACL)的相关文献,并对当前状态进行了概述,旨在促进现有概念的交叉和新思想的出现。ACL是深度强化学习成功的中坚力量,可用于改善样本效率和渐进性能,组织探索,鼓励泛化或解决稀疏奖励问题,等等。
Mar, 2020
调查了深度强化学习中迁移学习方法的最新进展,提供了对目标,方法,兼容强化学习骨架以及实际应用等方面分析的框架,并从强化学习的角度探讨了迁移学习与其他相关话题之间的联系和潜在挑战。
Sep, 2020
该研究将课程机器学习作为优化输运问题来量化和生成任务分布之间的移动,并提出了一种称为GRADIENT的算法来处理连续和离散背景下的非参数分布。 实验结果表明,该算法在学习效率和渐进性能方面均优于基线。
Oct, 2022
提出了一种基于师生课程学习的强化学习方法,该方法独立于人类领域知识和手动课程设置,可以改善学生的样本效率和通用性。
该论文介绍了一种名为SPC的新型自动课程学习框架,该框架将课程学习应用于多智能体协调中,通过赋予学生团体不变的通信和分层技能,在不同数量的代理任务中学习合作和行为技能,并在学生策略的条件下将老师建模为一个情境式赌博机,提高了MARL环境下的性能、可伸缩性和样本效率。
Feb, 2023
通过将课程设置为任务分布之间的插值,将生成课程作为约束优化传输问题来提高课程强化学习(CRL)方法的性能,从而在具有不同特点的各种任务中取得高性能。
Sep, 2023
通过对跨领域强化学习的了解和分类,以及对数据假设需求进行特征分析,本文全面系统地介绍了不同领域知识传递方法的研究,讨论了交叉领域知识传递的主要挑战以及未来研究方向。
Apr, 2024
采用逆序课程和正序课程相结合的方法,RFCL,在学习从示范中获得显著改进,并且能够解决过去无法解决的需要高精度和控制的任务。
May, 2024