BriefGPT.xyz
Ask
alpha
关键词
simulated robots
搜索结果 - 2
DexPBT:基于群体的训练的手臂系统熟练操控扩展
提出一种使用模拟机器人、多指手型器件等智能算法进行巧妙物体操控、亿进行种有挑战性的任务(如再抓取、抓取投掷、物体重新定位等),其中包括引入基于集群的 PBT 算法来快速扩展深度强化学习的探索能力,相比于端到端学习表现出更强的性能。
PDF
a year ago
利用大规模并行深度强化学习在几分钟内学会行走
本文介绍并研究了一种在单个工作站 GPU 上使用大量并行性实现快速生成真实世界机器人任务策略的训练设置,其中包括不同训练算法组件在大规模并行模式下对最终策略性能和训练时间的影响分析和讨论,同时还介绍了一种新颖的游戏启发课程,适用于数千个模拟
→
PDF
3 years ago
Prev
Next