Michał Zawalski, Michał Tyrolski, Konrad Czechowski, Damian Stachura, Piotr Piękos...
TL;DRAdaSubS 是一种自适应搜索方法,通过不同距离下生成不同的子目标,利用核实机制过滤不可达的子目标,实现长短子目标策略的高效平衡,从而在三个复杂推理任务中显著优于分层规划算法 —— 推箱子游戏,魔方和 INT 不等式证明基准。
Abstract
complex reasoning problems contain states that vary in the computational cost required to determine a good action plan. Taking advantage of this property, we propose adaptive subgoal search (AdaSubS), a search me