该研究将课程机器学习作为优化输运问题来量化和生成任务分布之间的移动,并提出了一种称为 GRADIENT 的算法来处理连续和离散背景下的非参数分布。 实验结果表明,该算法在学习效率和渐进性能方面均优于基线。
Oct, 2022
提出了一种基于师生课程学习的强化学习方法,该方法独立于人类领域知识和手动课程设置,可以改善学生的样本效率和通用性。
本文研究了如何通过选择不同目标函数,使用课程学习在强化学习中优化任务序列,提高初始性能,减少探索过程中的次优动作,并发现更好的策略。
Jan, 2019
本文介绍了一种广义的纠正学习方法,在优化输运的框架下,利用一个专家代理来改善学习代理的参数估计,该方法可以估计更复杂的特征,并考虑了多个干预策略。
Apr, 2023
基于近发展区概念,我们提出了一种名为 ProCuRL-Target 的新型课程计划,它可以在复杂任务的目标分布上平衡选择任务的需要,通过利用任务之间的相关性推动代理的学习,从而加速深度强化学习代理的训练过程。
May, 2024
本文研究课程学习在强化学习中的应用,并针对多个传递学习算法扩展已有的课程设计方法,通过学习 MDP(Markov Decision Process) 过程中的课程策略,得出可以用于训练代理人的课程,进而实现更快或同等方法的学习效率。
Dec, 2018
本文提出了强化学习中的课程学习框架,并使用此框架对现有的课程学习方法进行分类和研究,以找出未解决的问题并提出未来研究的方向。
Mar, 2020
利用熵正则化最优传输技术作为深度强化学习网络中的一层,以实现更快速的学习并在端到端训练期间强制执行分配约束和规定,从而对于解决组合优化问题的效率进行优化。
Mar, 2022
通过使用 Sinkhorn 映射来替换 Kullback-Leibler 散度,进一步提高多任务强化学习的数据效率,并通过实验证明新增的基于最优传输的奖励可以加速智能体的学习过程,优于多任务学习中的几个基准模型。
Sep, 2023
本研究运用强化学习方法,实现神经机器翻译中异质训练数据的有效生成和利用,提出课程学习框架,相比于传统方法,该方法展现出更好的表现和更强的数据泛化能力。
Feb, 2019