May, 2023

物理深度强化学习:安全性与未知未知

TL;DR本文中,我们提出了 Phy-DRL 框架:一种物理模型调节的深度强化学习框架,用于安全关键的自主系统。Phy-DRL 在三个方面独具创新:积极的未知 - 未知训练,连接残余控制,以及基于物理模型的神经网络编辑。在倒立摆和四足机器人上进行的实验结果证明了与纯数据驱动 DRL 相比,Phy-DRL 具有更少的学习参数,卓越的模型鲁棒性和安全保证。