Jun, 2022

使用强化学习实现人类水平的双手灵巧操作

TL;DR提出了双手灵巧操纵仿真器 Bi-DexHands,可用于机器人学习多种操纵技巧,其中单一代理策略 PPO 可达到人类 48 个月婴儿的操作水平,而多代理策略可进一步帮助掌握需要灵巧双手协作的操作任务,但现有 RL 算法在多任务和少样本学习设置下仍需要更深入的研究。