BriefGPT.xyz
Ask
alpha
关键词
cma-es
搜索结果 - 6
ICLR
身体 - 大脑共同演化的统一基质
通过引入神经细胞机器人基质(NCRS)的方法,使用单个神经细胞自动机(NCA)作为模块化机器人代理的基因组,使用协方差矩阵适应进化策略(CMA-ES)和协方差矩阵适应 MAP-Elites(CMA-ME)来训练 NCRS,以实现对机器人形态
→
PDF
2 years ago
ICML
元学习双向更新规则
本研究提出了一种广义神经网络,其中神经元和突触维护多个状态,通过基于链式法则的二值网络来推导出更新规则,并使用共享的低维 “基因组” 进行参数化,证明了该方法的泛化性和训练速度优于梯度下降优化器,可用于计算机视觉和合成任务。
PDF
3 years ago
AAAI
用于超参数优化的 CMA-ES 热启动
通过任务相似度的定义,将先前任务的经验直接迁移到初始化过的方法 CMA-ES 中,从而提高了它在具有相似任务的超参数优化中的表现。
PDF
4 years ago
PPO-CMA:具有协方差矩阵适应性的近端策略优化
提出了 Proximal Policy Optimization (PPO) 算法的改进版本 PPO-CMA,通过 adaptively 扩大 exploration variance 来加速算法优化速度,相对于传统 PPO 算法在 Rob
→
PDF
6 years ago
自编码增强的神经进化在视觉 Doom 游戏中的应用
通过训练自编码器来创造低维度的环境表征,并使用 CMA-ES 来训练神经网络控制器,从而解决神经进化在高维度控制器表示上的缩放问题,在基于 FPS Doom 的 VizDoom 环境中进行健康包采集任务,性能良好。
PDF
7 years ago
向 CMA-ES 中注入外部解决方案
本研究讨论如何将外部解决方案注入到 CMA-ES 算法中,并发现注入外部解决方案是一种可靠和有效的方法,导致了 CMA-ES 算法的精英变种和自适应编码等变体,可以在解决艰难问题时使收敛速度提高一倍。
PDF
13 years ago
Prev
Next