Sep, 2019

C-3PO: 循环三相优化的基于强化学习的人机动作复定向

TL;DR本文利用循环的三阶段优化算法基于深度强化学习技术来实现人机运动重新定向,通过精炼数据对其进行学习,提供了一种性能改进的框架。最终成功达到了人类骨架与多个机器人的运动重新定向技能。