Jun, 2024

通过延迟策略学习改善空中和陆地移动机器人控制的泛化性能

TL;DR通过延迟策略更新技术(DPU)对航空和陆地移动机器人进行的分析表明,这种技术极大地缓解了推广能力不足的问题,并加速了代理的学习过程,提高了它们在各种任务和未知场景中的效率。