May, 2024

从纯计划到纯策略与之间:采用递归树规划方法

TL;DR递归树规划(RTP)同时利用策略和贪心算法来改善规划性能和零样本迁移,使用广义 Dijkstra 算法作为搜索方法,将已学习的任务作为广义动作集合以提高规划性能,并在不同层次上添加原始动作。