多阶段强化学习中关键时期的重要性

ICMLAug, 2022

多阶段强化学习中关键时期的重要性

On the Importance of Critical Period in Multi-stage Reinforcement Learning

Junseok Park, Inwoo Hwang, Min Whoo Lee, Hyunseok Oh, Minsu Lee...

TL;DR该研究提出了一种多阶段强化学习策略，以强调在关键时期周围找到合适的刺激以形成奖励，从而提高 AI 代理的性能、效率和稳定性。

Abstract

The initial years of an infant's life are known as the critical period, during which the overall development of learning performance is significantly impacted due to neural plasticity. In recent studies, an

critical period neural plasticity ai agent learning ability multi-stage reinforcement learning

发现论文，激发创造

面向困难度调整的课程强化学习中的人类决策

研究人员设计了一个交互平台，利用人类的决策过程，通过向导课程强化学习结果，实现了成功地调整强化学习性能以适应人类期望困难程度的目标，并证明人类与计算机互动式课程增强学习的有效性，促进了该领域的发展。

Aug, 2022

神经网络的持续终生学习：综述

终身学习对于人类和动物至关重要，然而，在机器学习和神经网络模型中，随着不断获取非静态数据分布的信息，由于 “灾难性遗忘” 或干扰而面临着困难。本论文对于人类生物系统中的终身学习因素进行了总结，并比较了现有神经网络方法的差异。

Feb, 2018

基于强化学习的具身智能体通过互动与多感知模拟对人类用户进行建模

本文研究交互式机器学习的发展和应用，探讨人类反馈对于机器人行为的影响和提高机器人性能的方法，发现人类反馈参数对于任务性能的影响很大，需要更好地了解人类反馈的潜在变量以更好地处理人机交互领域的问题。

Jan, 2017

人工智能时代的认知科学：逆向工程婴儿语言学习者的路线图

通过机器学习和可穿戴技术等工程科学的显著进展，研究如何在复杂的学习环境下，通过分析婴儿的语言发展过程、比较婴儿与机器的学习成果以及通过多种测试手段对机器学习进行评估等一系列条件和措施来揭示婴儿语言习得的科学原理。

Jul, 2016

人工神经网络对人类语言习得的启示

通过使用机器学习及自然语言处理技术，研究语言习得过程，探讨如何让模型学习在有限的语言输入下获取语言知识，以验证关于人类语言学习本质的假说。

Aug, 2022

因果世界模型的内在激励学习

研究探索通过推断环境因果结构以收集相关干预数据为手段，建立捕捉传感器运动交互背后真实物理机制的世界模型对于提高深度学习、强化学习、迁移学习和泛化能力至关重要。

Aug, 2022

探索因果世界：通过知识转移和课程学习增强机器人操纵能力

使用强化学习训练三指机械臂的复杂任务，通过 fine-tuning 和 curriculum learning 的知识迁移策略提高学习效率和效果，并研究两种学习策略的关键因素及其效果，以应用于更广泛的基于学习的工程应用。

Mar, 2024

强化学习中的课程表政策学习

本文研究课程学习在强化学习中的应用，并针对多个传递学习算法扩展已有的课程设计方法，通过学习 MDP（Markov Decision Process) 过程中的课程策略，得出可以用于训练代理人的课程，进而实现更快或同等方法的学习效率。

Dec, 2018

自主系统从人类互动中的学习周期

探讨如何训练端到端的增强学习算法，提供了分类人类干预模式的模型，结合了不同的人机交互方式，定义了不同模式间的切换标准。

Aug, 2018

演员优先的经验回放

本文提出了一种新的经验回放采样框架，旨在解决深度强化学习模型 Prioritized Experience Replay (PER) 在连续控制任务上表现不佳的问题，同时还解决了 POLICY GRADIENT 问题和稳定性问题。在 extensive set of experiments 上证明该方法比现有算法表现更好。

Sep, 2022