BriefGPT.xyz
Ask
alpha
关键词
deep hierarchical reinforcement learning
搜索结果 - 2
通过强化学习与环境修正实现自动演绎路径学习
本文提出一种自动化结账方案,基于深层次强化学习方法解决了搜索空间巨大、历史记录匮乏等问题,通过构建分层的动作空间和部分观察的决策问题模型,在全球最大的电子支付业务上推广了这一方案。
PDF
a year ago
基于深度分层强化学习的智能 SDN 多播路由方法 DHRL-FNMR
该研究提出了一种基于深度分层强化学习的 SDN 智能多播路由算法来解决现有算法存在的问题,并构建了信息特征的状态空间和不同的行动空间。此外,还开发了可区分单步节点行动和多步行动向多目标节点的替代奖励策略来加速构建最优多播树的智能代理。
PDF
a year ago
Prev
Next