Sep, 2018

面向部分观测的基于模型的控制传播网络

TL;DR本文介绍了PropNet——一种可学习的动力学模型,能够在部分可观测场景下进行模型控制,并实现信号的即时传播。实验结果表明,与其他学习物理引擎相比,PropNet的前向模拟性能更好,在各种控制任务中也表现出更高的性能。与现有的模型无深度强化学习算法相比,使用Propagation Networks实现模型控制更准确、有效,且更具普适性。