NIPSMar, 2017

QMDP-Net: 基于深度学习的部分可观察性规划

TL;DRQMDP-net 是一种用于部分可观测性下规划的神经网络结构,结合了无模型学习和基于模型的规划的优势,并在预备实验中在多项机器人任务中表现出强大性能。