BriefGPT.xyz
Ask
alpha
关键词
action elimination
搜索结果 - 2
强化学习中具有防腐能力的探索策略
我们提出了一个框架,结合 “不确定性中的乐观主义” 和 “动作消除” 这两个策略,以解决领域中的非随机腐败问题,从而有效地实现了多阶段情节强化学习。
PDF
5 years ago
学会什么不去学:深度强化学习中的动作排除
该研究提出了一种名为 AE-DQN 的深度强化学习算法,该算法结合了 Action Elimination Network,并且通过外部环境的淘汰信号来优化选择更优的行为,该算法在纯文本游戏中取得了显著的优势。
PDF
6 years ago
Prev
Next