Oct, 2023
复杂和连续状态行动空间的专用深度残差策略安全强化学习控制器
Specialized Deep Residual Policy Safe Reinforcement Learning-Based Controller for Complex and Continuous State-Action Spaces
Ammar N. Abbas, Georgios C. Chasparis, John D. Kelleher
TL;DR传统控制器有局限性,深度强化学习通过在环境中进行探索来学习最优控制策略,为安全关键环境提出专门的深度残差策略安全强化学习方法,并在 Tennessee Eastman 过程控制中进行验证。