Mar, 2024

使用深度强化学习实现并行规划的元算符

TL;DR通过引入元操作符的概念,将元操作符包括在强化学习中的行动空间中,可以通过强化学习实现新的规划视角,如并行规划。本研究的主要目标是分析在强化学习过程中包含元操作符的性能和复杂性,具体应用于以往常规广义规划模型无法实现满意结果的领域,从而为重新定义与规划视角更加密切相关的强化学习行动空间铺平道路。