关键词neural episodic control
搜索结果 - 2
- 软件定义网络的无模型深度强化学习
本文比较了两种深度强化学习算法在软件定义网络的网络安全方面的应用:神经情景控制和深度 Q 网络。该论文通过类似于零和博弈的形式进行算法实现和比较,运用双尾 T 检验分析了两者游戏结果以及智能体的游戏得分,发现两个算法在表现方面没有显著的统计 - 神经元事件控制
本文提出了一种深度强化学习代理 —— 神经记忆控制器,该代理能够快速地接受和处理新经验并表现出针对这些经验的行为,并使用半表格化价值函数表示:包含缓慢变化状态表示和快速更新价值函数估计的过去经验缓冲区。研究表明,与其他最先进的通用型深度强化