利用概率集成神经网络动力学来桥接主动探索和不确定性感知部署
本研究旨在利用基于不确定性的深度网络动态模型来提高回报函数学习算法的样本效率,并通过样本传播方法实现不确定性处理,从而解决参数化函数逼近器,如深度网络的性能下降问题,我们提出了一种名为 PETS 的新算法。与深度强化学习的先进算法进行比较,结果表明我们的方法可以在 Asymptotic Performance 上与模型自由算法匹配,并且在许多具有挑战性的基准任务中需要明显较少的样本数量(例如,在半猎豹任务中所需样本数量比 Soft Actor Critic 和 Proximal Policy Optimization 分别减少 8 倍和 125 倍)。
May, 2018
我们引入了一种简单而有效的方法来管理基于模型的强化学习中的风险,该方法使用了概率安全约束、在确知不确定性面前的乐观和在事件性不确定性面前的悲观以及一组随机神经网络的平衡。各种实验证明,不确定性的分离对于在不确定和安全关键的控制环境中使用数据驱动的 MPC 方法表现良好是至关重要的。
Sep, 2023
提出了一种用基于贝叶斯信任网络和蒙特卡罗采样的方法来对神经网络进行不确定性估计,这个方法具有与神经网络结构和任务无关,不需要优化进程的更改,能够应用于已经训练好的结构,有效地提高了准确性。
Jul, 2019
本研究提出了一种基于模型的强化学习算法,通过训练具有可校准不确定性的神经网络动力学模型,实现对机器人系统控制器的快速学习,并在多项基准任务中验证了该算法的高效性和可扩展性,包括针对六足水下自主机器人的运动控制器学习。
Mar, 2018
通过使用动态组合选择技术,该研究提出了一种在模型级别上利用 Dirichlet 分布和多样性约束构建替代集成模型空间的方法,以保护模型免受白盒攻击并提高鲁棒性,同时结合动态和多样性特性,实现了显著的鲁棒性结果而不损害准确性。
Aug, 2023
在航空航天工程系统的高效设计探索中,使用嵌入仿真器的神经网络,并充分利用多样化数据源对多个模型实现进行训练,以评估由于训练样本不足而引起的认知建模不确定性,并在目标导向的自适应学习中提供关键信息。然而,由于集成模型的训练成本往往变得禁止并带来计算上的挑战,所以本研究提出使用快速神经网络范例的新型嵌入仿真器的神经网络,通过应用线性回归技术仅调整最后一层的连接权重,以在几乎即时训练的情况下保持预测准确性。该方法在多个分析实例和通用高超声速飞行器的航空参数研究中得到了验证。
Sep, 2023
本论文针对多移动机器人的分布式编队控制提出了一种提高现实可行性的新方法,首先采用变结构和级联设计技术引入分布式估计器,消除了对导数信息的需求以提高实时性能,然后采用仿生神经动力学方法开发了一种运动学跟踪控制方法,旨在提供平滑的控制输入并有效解决速度跳跃问题,此外还提出了一种基于学习的鲁棒动态控制器,以解决在完全未知动力学和干扰下操作的机器人的挑战,该控制器在实时参数估计的同时保持了其对干扰的鲁棒性,并通过严密的数学分析证明了所提方法的整体稳定性,最后,多个综合仿真研究表明了所提方法的优势和有效性。
Mar, 2024