Oct, 2022

基于视觉的机器人实时强化学习利用本地和远程计算机

TL;DR本研究提出了实时分布式学习系统 ReLoD,将两种深度强化学习算法 SAC 和 PPO 的计算分布在本地计算机和远程计算机上,评估结果表明 SAC 算法受资源限制影响较大,但适当的计算分配可显著改善其性能;而 PPO 算法不受计算分配影响。该系统是适用于多种机器人视觉任务的唯一公共实时强化学习系统。