使用脑启发的调制强化学习可以提高对环境变化的适应能力

May, 2022

使用脑启发的调制强化学习可以提高对环境变化的适应能力

Reinforcement Learning with Brain-Inspired Modulation can Improve Adaptation to Environmental Changes

Eric Chalmers, Artur Luczak

TL;DR研究提出了一种新的神经元学习规则，它使用突触前输入来调制预测误差，将其嵌入表格和深度 Q 网络强化学习算法中，可以在简单而高动态的任务中胜过传统算法，这提出了一种新的生物智能核心原则。

Abstract

Developments in reinforcement learning (RL) have allowed algorithms to achieve impressive performance in highly complex, but largely static problems. In contrast, biological learning seems to value efficiency of adaptation to a constantly-changing world. Here we build on a recently-pro

reinforcement learning biological intelligence neuronal learning rule prediction error dynamic tasks

发现论文，激发创造

随机网络中基于赫比塞塑性的元学习

受生物神经元可塑性启发，我们提出了一种搜索方法，通过寻找突触特异的赫比学习规则，使网络能在智能体的生命周期内持续自组织其权重，从而实现在一些强化学习任务中取得成功，同时对多种感官模态处理方式具有适应性。

Jul, 2020

具有自修改网络的元强化学习

提出了一个新型的元强化学习模型，MetODS，利用动态连接权重和突触可塑性来进行连续的自我反思修改，实现了在代理策略空间中高效和强大的控制规则的学习。

Feb, 2022

仿生学的神经元适应提高神经网络的学习能力

通过多层感知器和卷积神经网络，研究对比黑比学习和平衡传播算法及其加宽自适应能力的表现及其仿生学上的意义。

Apr, 2022

使用脑机接口区分学习规则

本文研究了生物可行的监督学习和强化学习规则，并提出了一种基于观察神经网络活动变化鉴别学习规则的方法，进而应用于大脑机器接口实验中，以模拟光标控制任务。

Jun, 2022

在脉冲神经网络中学习快速变化的缓慢

强化学习面临着应用于现实问题的巨大挑战，主要源于有限的与环境交互导致的可用数据的稀缺性。本研究引入了生物学上可行的近端策略优化的实现，通过在重要领域中显著减轻这一挑战，提高了学习的效率。

Jan, 2024

Backpropamine: 使用可微神经调节可塑性训练自修改神经网络

本文研究表明，神经可塑性的神经调节可被不同方式处理，并表明这种可塑性神经调节在神经网络训练上有广泛应用，可提高神经网络在强化学习和监督学习任务中的性能。

Feb, 2020

深度强化学习及其神经科学意义

这篇综述性研究论文介绍了深度强化学习在神经科学中的应用，讨论了其对大脑和行为研究的影响，并提出了未来研究的机会。

Jul, 2020

学习解决信用分配问题

本文提出了一种混合学习方法，即每个神经元使用强化学习策略来学习如何近似反向传播算法提供的梯度，并给出了对于特定类别的网络中，该方法收敛到真实梯度的证明。在前馈和卷积神经网络中，我们经验证明我们的方法学习如何逼近梯度，并且可以匹配或超越精确梯度学习的性能。学习反馈权重提供了一个生物学上可行的机制来实现良好的性能，无需精确的预先指定学习规则。

Jun, 2019

基于神经网络的量子反馈强化学习

本研究展示了利用神经网络强化学习在量子纠错任务中独立发现量子纠错策略的能力，并提出了包括二阶段学习和反馈优化在内的策略。这项工作不仅在量子计算方面具有重要作用，还显示了神经网络强化学习在物理学领域的潜力。

Feb, 2018

来自真实多智能体演示的强化学习中的自适应动作监督

本文提出了一种自适应动作监督的 RL 方法，通过动态时间规整的最小距离选择 RL 真实世界演示中的动作，使得 RL 模型能够在网络空间获得回报

May, 2023