Jul, 2022

PI-ARS:用预测信息表现加速演化学得的视觉 - 运动

TL;DR本研究中,我们开发了“预测信息增强随机搜索”(PI-ARS)方法,它结合了基于梯度的表示学习技术(PI)和基于梯度的无模型演化策略算法(ARS),以训练能够处理复杂机器人感知输入和处理高度非线性机器人动态的策略。该方法在足够复杂且难以处理的视觉驱动机器人任务中得到验证,相比于ARS的基线算法,在学习效率和性能方面均有显著提升,实际应用中100%的成功率大幅提高了之前40%的效果。