BriefGPT.xyz
大模型
Ask
alpha
关键词
robust spike-based rl method
搜索结果 - 1
脉冲 Q 学习的深度强化学习
本研究提出了一种名为 DSQN 的深度尖峰 Q 网络,使用非尖峰神经元的膜电压作为 Q 值的表示,可以从高维度的感官输入中直接学习稳健的决策,并在 17 个 Atari 游戏中表现出优异的性能,具有更好的学习稳定性和对抗攻击鲁棒性。
PDF
2 years ago
Prev
Next