Sep, 2023

AdaptNet:基于物理的角色控制的策略适应

TL;DRAdaptNet 是一种用于修改现有策略的潜在空间,通过在现有任务中快速学习和比较学习从头开始的新行为的方法,通过构建两层层次结构来有效地调整行为,并进一步修改策略网络层以实现更大的改变。该技术在适应基于物理的控制器到各种新的运动风格、新的任务目标、角色形态变化以及环境的广泛变化方面显示出显著的学习效率增加,通过与从头开始训练或使用其他修改现有策略的方法相比,大大减少了训练时间。