Aug, 2023

不仅有奖励还有约束:应用于四肢机器人的运动

TL;DR通过提出一种新颖的深度强化学习框架,我们展示了可用于训练复杂机器人系统的神经网络控制器,该框架通过引入约束条件减少了奖励工程的工作量,并实现了较高的任务绩效。