关键词parameterized action space
搜索结果 - 2
- 参数化动作空间中的混合演员 - 评论家强化学习
介绍了一种混合体结构的深度强化学习算法,其包含多个并行的子演员网络和一个评论家网络,可以将结构化的行动空间分解为更简单的行动空间,并指导所有子演员网络的训练。该算法在参数化行动空间中展示了出色的表现。
- AAAI参数化动作空间中强化学习的分层方法
本文提出了一种用于在参数化操作空间中进行强化学习的新型紧凑架构,并探讨了如何使用现有算法(TRPO, SVG)进行训练,结果表明这些方法在测试时优于当前最先进的方法 Parameterized Action DDPG。