May, 2023

DexPBT:基于群体的训练的手臂系统熟练操控扩展

TL;DR提出一种使用模拟机器人、多指手型器件等智能算法进行巧妙物体操控、亿进行种有挑战性的任务(如再抓取、抓取投掷、物体重新定位等),其中包括引入基于集群的PBT算法来快速扩展深度强化学习的探索能力,相比于端到端学习表现出更强的性能。