多阶段强化学习中关键时期的重要性
研究人员设计了一个交互平台,利用人类的决策过程,通过向导课程强化学习结果,实现了成功地调整强化学习性能以适应人类期望困难程度的目标,并证明人类与计算机互动式课程增强学习的有效性,促进了该领域的发展。
Aug, 2022
终身学习对于人类和动物至关重要,然而,在机器学习和神经网络模型中,随着不断获取非静态数据分布的信息,由于 “灾难性遗忘” 或干扰而面临着困难。本论文对于人类生物系统中的终身学习因素进行了总结,并比较了现有神经网络方法的差异。
Feb, 2018
本文研究交互式机器学习的发展和应用,探讨人类反馈对于机器人行为的影响和提高机器人性能的方法,发现人类反馈参数对于任务性能的影响很大,需要更好地了解人类反馈的潜在变量以更好地处理人机交互领域的问题。
Jan, 2017
通过机器学习和可穿戴技术等工程科学的显著进展,研究如何在复杂的学习环境下,通过分析婴儿的语言发展过程、比较婴儿与机器的学习成果以及通过多种测试手段对机器学习进行评估等一系列条件和措施来揭示婴儿语言习得的科学原理。
Jul, 2016
研究探索通过推断环境因果结构以收集相关干预数据为手段,建立捕捉传感器运动交互背后真实物理机制的世界模型对于提高深度学习、强化学习、迁移学习和泛化能力至关重要。
Aug, 2022
使用强化学习训练三指机械臂的复杂任务,通过 fine-tuning 和 curriculum learning 的知识迁移策略提高学习效率和效果,并研究两种学习策略的关键因素及其效果,以应用于更广泛的基于学习的工程应用。
Mar, 2024
本文研究课程学习在强化学习中的应用,并针对多个传递学习算法扩展已有的课程设计方法,通过学习 MDP(Markov Decision Process) 过程中的课程策略,得出可以用于训练代理人的课程,进而实现更快或同等方法的学习效率。
Dec, 2018
本文提出了一种新的经验回放采样框架,旨在解决深度强化学习模型 Prioritized Experience Replay (PER) 在连续控制任务上表现不佳的问题,同时还解决了 POLICY GRADIENT 问题和稳定性问题。在 extensive set of experiments 上证明该方法比现有算法表现更好。
Sep, 2022