Nov, 2018

通过深度强化学习管理具有大状态和动作空间的工程系统

TL;DR本文提出了一种综合的深度强化学习框架 - DCMAC,使用深度函数近似和分解表示系统动作来提供高维空间中大型多组件系统的高效生命周期策略,相对于基于时间、条件和周期策略的优化基线,DCMAC 表现更好。