Mar, 2024

双向渐进神经网络与情节回报进展用于新兴任务排序和机器人技能迁移

TL;DR人脑和行为为机器人学习和控制方法提供了灵感,该研究介绍了一种新的多任务强化学习框架 ERP-BPNN,它具有人类类似的交替学习方式,可实现任务间的双向技能转移,并在达到任务中与传统方法相比,对于形态不同的机器人在到达目标的距离、路径直线性等度量指标上实现了更快的收敛和改进。