Jun, 2022
使用强化学习实现人类水平的双手灵巧操作
Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning
Yuanpei Chen, Tianhao Wu, Shengjie Wang, Xidong Feng, Jiechuang Jiang...
TL;DR提出了双手灵巧操纵仿真器 Bi-DexHands,可用于机器人学习多种操纵技巧,其中单一代理策略 PPO 可达到人类 48 个月婴儿的操作水平,而多代理策略可进一步帮助掌握需要灵巧双手协作的操作任务,但现有 RL 算法在多任务和少样本学习设置下仍需要更深入的研究。