基于实时模型无关深度强化学习的串级弹性执行器力控制

Apr, 2023

基于实时模型无关深度强化学习的串级弹性执行器力控制

Real-Time Model-Free Deep Reinforcement Learning for Force Control of a Series Elastic Actuator

Ruturaj Sambhus, Aydin Gokce, Stephen Welch, Connor W. Herron, Alexander Leonessa

TL;DR该研究使用深度强化学习（DRL）方法，通过 Proximal Policy Optimization（PPO）算法，在 SEA 振荡系统的硬件环境中训练一个 DRL 策略，以实现高精度的力控制任务。研究结果表明，该 DRL 策略优于传统的基于模型的 PID 控制器，并能够实现更好的跟踪和稳定性保障。

Abstract

Many state-of-the art robotic applications utilize series elastic actuators (SEAs) with closed-loop force control to achieve complex tasks such as walking, lifting, and manipulation. Model-free PID control methods are more prone to instability due to nonlinearities in the SEA where cas

series elastic actuator robotic applications deep reinforcement learning model-free method continuous control task

发现论文，激发创造

基于模型的深度强化学习电压控制策略高效学习

提出了一种基于模型的深度强化学习方法，用于设计短期电压稳定性问题的紧急控制策略，并使用基于深度神经网络的动态代理模型进行训练，最终在 IEEE 300 总线测试系统上实现了 97.5% 的样本效率和 87.7% 的训练效率。

Dec, 2022

物理深度强化学习：安全性与未知未知

本文中，我们提出了 Phy-DRL 框架：一种物理模型调节的深度强化学习框架，用于安全关键的自主系统。Phy-DRL 在三个方面独具创新：积极的未知 - 未知训练，连接残余控制，以及基于物理模型的神经网络编辑。在倒立摆和四足机器人上进行的实验结果证明了与纯数据驱动 DRL 相比，Phy-DRL 具有更少的学习参数，卓越的模型鲁棒性和安全保证。

May, 2023

通过深度强化学习控制流体弹球上的水动力力量

本文使用深度强化学习算法构建了一个实时反馈策略，用于实现流体弹球系统的流体动力学力控制和追踪，结果表明该策略在复杂流体动力学问题上的控制决策效果理想，可为其他复杂流体动力学问题的高效活动控制策略提供探索。

Apr, 2023

学习物理知识驱动的软体机器人操作仿真模型：以电致弹性体致动器为例的案例研究

本研究提出了一种基于不同 iable simulator 的软致动器物理可行模型的训练方法，其通过与有限元方法结合来实现闭环控制，基于该模型构建 MPC 控制器，实现对硬币的拉动并获得了低于 5％的仿真误差。

Feb, 2022

使用深度强化学习控制混沌系统

本文利用基于模型的强化学习算法，结合深度神经网络，针对一维 Kuramoto-Sivashinsky 方程描述的非线性混沌系统进行控制，通过局部测量得到的限制性传感器数据指引控制策略，实现了混沌状态下目标状态的稳定控制，并有望在复杂的液体系统控制领域中得到广泛应用。

Jun, 2019

基于深度强化学习的非线性电力系统无模型负荷频率控制

该研究提出了一种基于深度确定性策略梯度（DDPG）框架的无模型负荷频率控制方法，通过建立仿真器网络来模拟电力系统动力学，实现了对非线性电力系统的控制，并通过零阶优化（ZOO）和反向传播算法有效地优化了演员网络控制器。仿真结果表明，该设计的控制器能够生成适当的控制动作，并对非线性电力系统具有较强的适应性。

Mar, 2024

弹性时间步长的强化学习

传统强化学习算法通常在机器人技术中用于学习具有固定控制频率的控制器。本文提出 Soft Elastic Actor-Critic（SEAC），这是一种新颖的离策略演员 - 评论家算法，旨在解决控制频率选择问题，通过实现弹性时间步长（具有已知可变时长的时间步长），使代理能够根据情况变化其控制频率，从而最大程度地减少计算资源和数据使用，提高能量效率和总体时间管理能力，尤其是在强化学习算法难以收敛的控制频率下，SEAC 表现出更快速和更稳定的训练速度。此外，与类似方法 Continuous-Time Continuous-Options（CTCO）模型相比，SEAC 的任务性能更好，突出了 SEAC 在实际机器人强化学习应用中的潜力。

Feb, 2024

缩放机器人车辆的建模、定位和深度强化学习路径跟踪控制：设计与实验验证

移动机器人系统中，提出了一种分散拓展的扩展卡尔曼滤波器和一种通过专家演示器训练的强化学习路径跟踪控制器的新颖方案，实验结果表明，FEKF 能够改善移动机器人位置的估计，AI 解决方案能够胜过基于模型的控制策略和演示器，同时通过一系列性能指标对比评估与基准控制器。

Jan, 2024

深度强化学习实现高速自主漂移

本研究采用最新的深度强化学习算法（软演员 - 评论家），提出了一种不需要明确运动方程的强健漂移控制器，通过对不同难度的赛道进行训练，使车辆能够快速、稳定地漂移通过各种锐利的拐角，控制器被证明具有良好的泛化能力，可以直接处理具有不同物理特性的不同类型的车辆。

Jan, 2020

基于模型的深度强化学习的神经网络动态和无模型微调

该研究论文表明，中等大小的神经网络模型实际上可以与模型预测控制（MPC）相结合，以实现在模型为基础的强化学习算法中的良好样本复杂度，并以提高深度神经网络动力学模型的样本效率为目的初始化模型自由学习。

Aug, 2017