Oct, 2021

通过参数化行为基元加速机器人强化学习

TL;DR本研究探讨了使用机器人行动原语以改善强化学习代理的难度探索和性能,并提出了一种新的界面设计,将学习参数化行动原语的 RL 策略与机器人的交互结合起来,最终在三个不同的领域、图像输入和稀疏终端奖励下,显著提高了学习效率和任务性能。