Sep, 2017

通用计算图的自监督深度强化学习在机器人导航中的应用

TL;DR提出一种广义计算图,包含基于价值的无模型方法和基于模型的方法,通过学习从原始图像中学习导航模型,实现样本高效,并利用模拟实验和实际应用验证了新方法的优越性。