Apr, 2024

机器人控制的自适应强化学习

TL;DR深度强化学习在模拟环境中取得了显著的成功,但在设计机器人控制器方面的应用仍然有限,由于其单任务导向性和对环境变化的适应能力不足。为了克服这些限制,我们提出了一种新颖的自适应智能体,利用迁移学习技术在不同任务和环境条件下动态调整策略。该方法经过了齐腾博仿真挑战的验证,其中多任务能力和环境适应能力至关重要。智能体使用基于 IsaacGym 的定制化高度并行化的模拟器进行训练,通过零样本迁移在真实世界中飞行气球以解决各种任务。我们在 https://github.com/robot-perception-group/adaptive_agent/ 上分享我们的代码。