Sep, 2017

行动模式网络:深度学习的广义策略

TL;DR介绍了Action Schema Network(ASNet):一种用于学习概率规划问题通用策略的神经网络模型。通过模拟规划问题的关系结构,ASNet能够采用权重共享方案,使网络能够应用于给定规划域中的任何问题。此外,提出一种平衡探索和监督训练的训练方法,以产生在评估较大问题时仍保持稳健的策略。在实验中,我们展示了ASNet的学习能力让其在多个具有挑战性的领域中明显优于传统的非学习规划者。