Oct, 2023

复杂和连续状态行动空间的专用深度残差策略安全强化学习控制器

TL;DR传统控制器有局限性,深度强化学习通过在环境中进行探索来学习最优控制策略,为安全关键环境提出专门的深度残差策略安全强化学习方法,并在 Tennessee Eastman 过程控制中进行验证。