Aug, 2024

基于决策的学习以预测规划中的行动成本

TL;DR本文解决了自动化规划中行动成本难以指定的问题,提出了一种基于决策的学习方法以预测这些成本。研究首次探讨了将该方法应用于自动规划的挑战,并提出了新的梯度计算和缓存机制,从而显著提高了规划质量,并降低了计算要求。