Aug, 2017

使用深度神经网络学习广义反应策略

TL;DR本文提出了一种新的学习规划的方法,使用深度神经网络学习 “广义反应策略”(GRP),以映射问题实例和状态到动作,并用于自动学习启发式函数,通过对两个困难的规划问题领域的广泛实验,我们展示了使用我们的方法可以简化决策制定的复杂性和减少人类干预。