Sep, 2016

深度 Q-Learning 机器人臂控制的 3D 模拟

TL;DR该研究旨在使用深度强化学习算法,通过在模拟环境中训练机器人臂完成定位和抓取方块的任务,进而实现在真实场景下机器人控制的无缝转移,并设计了结构化奖励函数以提高训练效率。