Feb, 2019

使用前向 - 后向 SDE 学习深度随机最优控制策略

TL;DR本文提出了一种基于非线性随机最优控制理论、应用数学和机器学习的不确定性决策制定新方法。我们开展了一项控制框架的研究,旨在解决机器人和自主决策问题中的不确定性,并提出了一种深度神经网络架构用于随机控制。在仿真非线性系统中,我们研究了所提算法的性能和可扩展性,并讨论了未来的研究方向及其对机器人技术的影响。