Jun, 2024

基于潜空间目标的最优控制的深度强化学习行为模式切换

TL;DR利用最优控制在深度强化学习策略的潜在空间中进行优化,识别并切换行为模式,结果表明该方法能够使策略产生所需的行为模式。