通过融合和演化赫比学习规则：通过减少规则的数量增强泛化能力

Apr, 2021

通过融合和演化赫比学习规则：通过减少规则的数量增强泛化能力

Evolving and Merging Hebbian Learning Rules: Increasing Generalization by Decreasing the Number of Rules

Joachim Winther Pedersen, Sebastian Risi

TL;DR通过演化和合并 Hebbian 学习规则并将多个连接分配到单个规则中来改善人工智能代理的鲁棒性，并通过 K-Means 聚类方法将规则组合来大幅减少可训练参数的数量，进而提高代理的适应性。

Abstract

Generalization to out-of-distribution (OOD) circumstances after training remains a challenge for artificial agents. To improve the robustness

out-of-distribution artificial agents hebbian learning robustness genomic bottleneck

发现论文，激发创造

随机网络中基于赫比塞塑性的元学习

受生物神经元可塑性启发，我们提出了一种搜索方法，通过寻找突触特异的赫比学习规则，使网络能在智能体的生命周期内持续自组织其权重，从而实现在一些强化学习任务中取得成功，同时对多种感官模态处理方式具有适应性。

Jul, 2020

神经元为中心的赫布学习

脑的学习机制中最引人注目的能力之一是通过结构和功能可塑性对其突触进行适应。然而，大多数用于人工神经网络的可塑性模型专注于突触而非神经元，因此优化了突触特定的 Hebbian 参数。为了克服这个限制，我们提出了一种新的可塑性模型，称为神经元为中心的 Hebbian 学习 (NcHL)，其中优化专注于神经元特定的 Hebbian 参数。和 ABCD 规则相比，NcHL 将参数数量从 5W 减少到 5N，其中 W 和 N 分别为权重和神经元的数量，通常 N 远小于 W。在两个机器人运动任务的实验证明，尽管使用的参数数量少得多（约为 97 倍），但 NcHL 与 ABCD 规则的性能相当，因此具有可扩展的可塑性。

Feb, 2024

元学习双向更新规则

本研究提出了一种广义神经网络，其中神经元和突触维护多个状态，通过基于链式法则的二值网络来推导出更新规则，并使用共享的低维 “基因组” 进行参数化，证明了该方法的泛化性和训练速度优于梯度下降优化器，可用于计算机视觉和合成任务。

Apr, 2021

约束进化体现神经智能的共同设计

通过深度强化学习和进化算法以及用户控制相结合的方法，介绍了一种创新的协同设计方法，以形态属性和运动为自主移动代理提供良好的设计和行为。

May, 2022

基于 Hebbian 学习的线性回归参数估计

通过建立上下界，我们证明了这种 Hebbian 学习规则在仅有线性回归损失的查询可用时，可以实现比任何独立于数据选择查询的非自适应方法更快的收敛速度。

Sep, 2023

利用赫布学习预测星际争霸 II 中集群的演变

本文提出了一种混合 AI 模型，将无监督学习和自监督学习相结合，以预测 StarCraft II 游戏中集群的演变，其中，无监督的 Hebbian 学习方法被应用于产生可变数量的集群，并且在预测任务中，使用基于长短期记忆的预测模块来预测集群的状态向量。实验结果表明，该模型成功地预测了集群的演化。

Aug, 2022

Learngene: 从开放世界走向你的学习任务

提出了一种实用的集体 - 个体范式，该范式在序列任务上训练一个进化（可扩展）网络，并且通过从集体模型中发现 learngene，重建轻量级个体模型，经过实验研究和理论分析证明，本文的方法在实现 few-shot learning 场景中取得了很好的效果

Jun, 2021

使用脉冲神经网络演化学习强化学习任务

本研究基于大自然神经系统的启发，应用突触可塑性规则训练带有局部信息的脉冲神经网络，使其适用于神经形态硬件的在线学习。其目的在于通过应用进化算法，使得各种不同任务的学习过程变得更加简单，通过提供一组各种局部信号、数学算子和全局奖励信号来找到最佳学习规则，我们发现通过这种方法可以成功解决 XOR 和车杆任务，并发现新的学习规则优于文献中的基准规则。

Feb, 2022

StarCraft II 中基于点集的无监督 Hebbian 学习

本文介绍了一种新颖的 Hebbian 学习方法，以提取 StarCraft II 游戏单位中的点集的全局特征，并将其应用于预测点的移动，实验证明该模型比自监督学习方法具有更低的预测损失和更低的计算成本。

Jul, 2022

学习可推广到分布外的模块化结构

本文提出一种针对机器学习系统中的 O.O.D. generalization 挑战的方法，通过训练鼓励模型仅保留在多个训练领域中被很好地重用的网络特征，结合两种互补的神经元级约束器和网络上的可微分二进制蒙版，提取模块化子网络以达到更好的 O.O.D. 性能。初步评估在两个基准数据集上证实了我们方法的优势。

Aug, 2022