Feb, 2022

REvolveR:机器人间策略转移的连续进化模型

TL;DR通过在物理模拟器中使用连续进化的模型来实现机器人策略的传递,可以在新机器人上实现优秀的样本利用率,特别是在稀疏奖励的情况下,可以显著减少探索。