Apr, 2023

基于实时模型无关深度强化学习的串级弹性执行器力控制

TL;DR该研究使用深度强化学习(DRL)方法,通过 Proximal Policy Optimization(PPO)算法,在 SEA 振荡系统的硬件环境中训练一个 DRL 策略,以实现高精度的力控制任务。研究结果表明,该 DRL 策略优于传统的基于模型的 PID 控制器,并能够实现更好的跟踪和稳定性保障。