Apr, 2024

学习完全可观察的非确定性计划领域的广义策略

TL;DR扩展学习通用策略的公式和组合方法以解决完全可观察、非确定性(FOND)领域的规划问题,通过实验证实所得方法在多个 FOND 规划基准领域上,并验证了其正确性。学习 FOND 规划的通用策略方法可以被视为在抽象空间中寻找解决方案的一种替代 FOND 规划方法,该抽象空间由需要学习的特征定义。