探索深度和循环结构用于最优控制

NIPSNov, 2013

探索深度和循环结构用于最优控制

Exploring Deep and Recurrent Architectures for Optimal Control

Sergey Levine

TL;DR本文研究了多层神经网络在控制方面的应用，特别是在连续高维动作任务中，通过强化学习训练后实现了控制策略，结果表明可以成功训练具有成千上万个参数的神经网络控制器，并比较了各种不同结构。文章讨论了这一问题与以往有监督知觉任务的区别，呈现了实验结果，并讨论了将深度学习技术应用于控制问题优化的未来方向。

Abstract

Sophisticated multilayer neural networks have achieved state of the art results on multiple supervised tasks. However, successful applications of such multilayer networks to control have so far been limited large

multilayer neural networks control deep learning reinforcement learning optimal control

发现论文，激发创造

机器人学习控制的深度网络解决方案综述：从强化到模仿

该研究论文针对使用深度学习技术学习机器人控制策略，对深度强化学习和模仿学习两种主要学习控制范式进行了综述，包括了应对从模拟环境到现实场景中真实性差距的挑战，并总结了机器人仿真平台用于开展深度强化学习研究，同时介绍了三种主要的模仿学习范式及其相应的机器人应用，最终讨论了开放性挑战和研究前沿。

Dec, 2016

控制任务中的循环架构的神经进化

该研究提出了一种新方法，即利用少量的突变规则来动态演化循环神经网络的结构，其结果表明，这种方法可以在大多数情况下匹配或超过梯度下降方法的性能，同时使用数量级更少的参数，该方法有望在对网络紧凑性和自主设计至关重要的实际应用方面开辟新的途径。

Apr, 2023

神经网络优化控制：凸逼近方法

本文介绍使用凸神经网络实现模型精确度和控制可行性之间的平衡，通过设计凸性的循环神经网络来捕获动态系统的时态行为，并且可以通过解决凸问题来实现最优控制器。实验结果表明，该方法在控制应用中具有良好的潜力。

May, 2018

深度多任务神经网络解决一些随机最优控制问题

本研究论文采用多任务神经网络的有效解法，通过数值实验，证明其在处理实际金融衍生品定价问题上优于现有方法。

Jan, 2024

通过转移模型学习连续控制策略

通过学习过渡模型，我们可以使用它来驱动摊销政策的学习。因此，我们重访了政策优化并描述了一个模块化神经网络架构，该架构从预测错误中同时学习了系统动力学和生成适当连续控制命令的随机策略，并通过与线性二次调节器的基线进行比较来评估模型。

Sep, 2022

深度视觉动作策略的端到端训练

该研究旨在回答：联合端到端训练感知和控制系统是否比单独训练每个组件提供更好的性能？通过使用卷积神经网络表示，并在一系列需要视觉和控制之间紧密协作的真实世界操纵任务上进行评估。

Apr, 2015

神经网络策略中实施鲁棒控制保证

通过将人工神经网络用于构建通用非线性控制策略并结合凸优化投影层，本论文提出了一种能在保持鲁棒性的同时提高控制系统的平均性能的技术，同时在非鲁棒的深度强化学习（deep RL）方法的最坏情况稳定性方面也有所提高。

Nov, 2020

强壮的四足机器人神经动力学的群体层面分析

利用计算神经科学分析机器人运动控制的人口群体行为，研究表明在强迫状态和拓扑结构之下，循环状态动力学的结构化和低维的特点与类人研究吻合，振荡系统在可控的神经扰动下，更强地依赖感官输入。

Jun, 2023

深度跟踪控制：用于多功能和鲁棒运动的基于模型规划和强化学习的统一方法

通过结合在线规划的预测能力和离线学习的内在稳健性，我们提出了一个混合控制架构，以同时实现更高的稳健性、脚步精确度和地形泛化。

Sep, 2023

自主车辆控制的深度学习应用调查

这篇论文调查了应用深度学习方法控制汽车的研究进展和存在的挑战，研究重点在于车辆控制而非感知问题，涵盖计算、架构、目标、泛化、验证和安全方面的探讨，为智能交通系统相关的领域提供及时有效的信息。

Dec, 2019