Mar, 2024

GeRM:一种混合专家四足机器人的通用模型

TL;DRGeRM 是一种多任务机器人学习方法,利用离线强化学习优化数据利用策略来从示范和次优数据中学习,通过引入专家混合结构解决有限的强化学习参数问题,并提供更快的推理速度和更高的模型容量,同时控制计算成本,在多任务学习中提高模型性能。通过一系列实验验证 GeRM 在所有任务上的优越性,并展示其在训练和推理过程中的效率,同时揭示其获取新技能的潜力。此外,我们还贡献了 QUARD-Auto 数据集,该数据集由自动收集,以支持我们的训练方法并推动多任务四足机器人学习的进展。这项工作为减少机器人数据收集成本和推动多任务学习社区的进步提供了一种新的范例。