利用概率集成神经网络动力学来桥接主动探索和不确定性感知部署

May, 2023

利用概率集成神经网络动力学来桥接主动探索和不确定性感知部署

Bridging Active Exploration and Uncertainty-Aware Deployment Using Probabilistic Ensemble Neural Network Dynamics

Taekyung Kim, Jungwi Mun, Junwon Seo, Beomsu Kim, Seongil Hong

TL;DR该研究提出了一个基于模型的强化学习框架，将主动探索和不确定性感知部署这两个任务结合了起来，通过 Jensen-Renyi 分歧量化确定性，最终在自主驾驶车辆和轮式机器人上进行了成功的实验。

Abstract

In recent years, learning-based control in robotics has gained significant attention due to its capability to address complex tasks in real-world environments. With the advances in →

learning-based control robotics machine learning algorithms active exploration uncertainty-aware deployment

发现论文，激发创造

使用概率动态模型进行少量试验的深度强化学习

本研究旨在利用基于不确定性的深度网络动态模型来提高回报函数学习算法的样本效率，并通过样本传播方法实现不确定性处理，从而解决参数化函数逼近器，如深度网络的性能下降问题，我们提出了一种名为 PETS 的新算法。与深度强化学习的先进算法进行比较，结果表明我们的方法可以在 Asymptotic Performance 上与模型自由算法匹配，并且在许多具有挑战性的基准任务中需要明显较少的样本数量（例如，在半猎豹任务中所需样本数量比 Soft Actor Critic 和 Proximal Policy Optimization 分别减少 8 倍和 125 倍）。

May, 2018

谨防不确定性：风险意识和积极探索模型的基于强化学习

我们引入了一种简单而有效的方法来管理基于模型的强化学习中的风险，该方法使用了概率安全约束、在确知不确定性面前的乐观和在事件性不确定性面前的悲观以及一组随机神经网络的平衡。各种实验证明，不确定性的分离对于在不确定和安全关键的控制环境中使用数据驱动的 MPC 方法表现良好是至关重要的。

Sep, 2023

机器人操作中贝叶斯模型的主动探索

通过积极学习方法和贝叶斯神经网络模型，提高机器人操纵的模型质量和数据效率，以应对复杂环境下的多任务处理挑战。

Apr, 2024

深度学习不确定性估计的通用框架

提出了一种用基于贝叶斯信任网络和蒙特卡罗采样的方法来对神经网络进行不确定性估计，这个方法具有与神经网络结构和任务无关，不需要优化进程的更改，能够应用于已经训练好的结构，有效地提高了准确性。

Jul, 2019

具有模型不确定性估计的安全强化学习

使用 MC-Dropout 和 Bootstrapping 方法来提高安全驾驶机器人的模型稳定性，实现在未知数据情况下的碰撞回避。

Oct, 2018

基于概率模型的强化学习合成神经网络控制器

本研究提出了一种基于模型的强化学习算法，通过训练具有可校准不确定性的神经网络动力学模型，实现对机器人系统控制器的快速学习，并在多项基准任务中验证了该算法的高效性和可扩展性，包括针对六足水下自主机器人的运动控制器学习。

Mar, 2018

基于深度神经网络不确定性估计的动态集成选择以提高对抗鲁棒性

通过使用动态组合选择技术，该研究提出了一种在模型级别上利用 Dirichlet 分布和多样性约束构建替代集成模型空间的方法，以保护模型免受白盒攻击并提高鲁棒性，同时结合动态和多样性特性，实现了显著的鲁棒性结果而不损害准确性。

Aug, 2023

基于高斯过程或贝叶斯神经网络的有约束轨迹探索的主动学习性能比较

自主机器人和主动学习算法在空间任务中的应用及性能比较研究。

Sep, 2023

适应性学习的快速神经网络集成的认识建模不确定性

在航空航天工程系统的高效设计探索中，使用嵌入仿真器的神经网络，并充分利用多样化数据源对多个模型实现进行训练，以评估由于训练样本不足而引起的认知建模不确定性，并在目标导向的自适应学习中提供关键信息。然而，由于集成模型的训练成本往往变得禁止并带来计算上的挑战，所以本研究提出使用快速神经网络范例的新型嵌入仿真器的神经网络，通过应用线性回归技术仅调整最后一层的连接权重，以在几乎即时训练的情况下保持预测准确性。该方法在多个分析实例和通用高超声速飞行器的航空参数研究中得到了验证。

Sep, 2023

基于生物启发神经动力学的移动机器人分布式稳健学习形成控制

本论文针对多移动机器人的分布式编队控制提出了一种提高现实可行性的新方法，首先采用变结构和级联设计技术引入分布式估计器，消除了对导数信息的需求以提高实时性能，然后采用仿生神经动力学方法开发了一种运动学跟踪控制方法，旨在提供平滑的控制输入并有效解决速度跳跃问题，此外还提出了一种基于学习的鲁棒动态控制器，以解决在完全未知动力学和干扰下操作的机器人的挑战，该控制器在实时参数估计的同时保持了其对干扰的鲁棒性，并通过严密的数学分析证明了所提方法的整体稳定性，最后，多个综合仿真研究表明了所提方法的优势和有效性。

Mar, 2024