Jan, 2022

脉冲 Q 学习的深度强化学习

TL;DR本研究提出了一种名为 DSQN 的深度尖峰 Q 网络,使用非尖峰神经元的膜电压作为 Q 值的表示,可以从高维度的感官输入中直接学习稳健的决策,并在 17 个 Atari 游戏中表现出优异的性能,具有更好的学习稳定性和对抗攻击鲁棒性。