Jun, 2024
基于潜空间目标的最优控制的深度强化学习行为模式切换
Deep Reinforcement Learning Behavioral Mode Switching Using Optimal Control Based on a Latent Space Objective
Sindre Benjamin Remman, Bjørn Andreas Kristiansen, Anastasios M. Lekkas
TL;DR利用最优控制在深度强化学习策略的潜在空间中进行优化,识别并切换行为模式,结果表明该方法能够使策略产生所需的行为模式。