Oct, 2023

基于权重合并的船队策略学习及其在机器人工具使用中的应用

TL;DR研究通过分布式学习实现机器人舰队在各种环境中获得多样化技能的方法,并介绍了 fleet-merge 方法用于合并参数化的递归神经网络策略,在 Meta-World 环境中有效地合并 50 个任务的策略,并在机器人工具使用基准测试中验证了 fleet-merge 的功效。