May, 2021

探索多样的运动跳跃策略

TL;DR本文提出了一个结合物理模拟与深度强化学习的自动控制策略训练框架,以发现多样且自然的运动技能策略,包括高跳和障碍跳。通过初始角色状态探索,参考自然运动姿态,结合样本高效的贝叶斯差异搜索算法,可以发掘出丰富多样的新型策略。