BriefGPT.xyz
大模型
Ask
alpha
关键词
simulated bipedal locomotion
搜索结果 - 1
多技能动作控制的渐进式蒸馏强化学习
本文研究在连续控制问题中如何将多个专项技能的策略组合在一起,为了解决这个问题作者扩展了策略蒸馏方法并通过模拟双足步态跨越不同类地形的领域中评估了该技术,同时还引入了一种输入注入方法来利用新的输入特征,最后,作者使用迁移学习来协助高效地获得新
→
PDF
6 years ago
Prev
Next