BriefGPT.xyz
Ask
alpha
关键词
guided policy search
搜索结果 - 5
引导策略搜索作为近似镜像下降
该论文提出了一种新的指导策略搜索算法,将其解释为镜像下降的近似变体,并提供了改善收敛性的保证。实验结果表明,该算法在机器人导航和操作任务中的表现优于之前的指导策略搜索方法,并且具有更简单的公式和更少的超参数。
PDF
8 years ago
学习优化
本篇论文探讨了通过强化学习的方法生成优化算法,该方法可自动发现更好的算法,并通过指导策略搜索学习出的优化算法在收敛速度和 / 或最终目标值方面优于手工设计的现有算法。
PDF
8 years ago
基于 MPC 引导的策略搜索学习自主飞行器深度控制策略
模型预测控制与强化学习相结合并在引导策略搜索框架下应用,通过使用机载传感器数据在训练时间内训练神经网络策略,该策略可成功地控制四旋翼飞行器的避障而无需系统完整状态知识。
PDF
9 years ago
使用连续内存状态学习深度神经网络策略
通过内部记忆的方法,学习适用于高维连续系统(如机器人操纵器)的策略,通过把记忆状态加到系统的状态和动作空间中,使用有监督学习方法 Guided Policy Search 分解策略搜索问题,并通过轨迹优化和监督学习相结合的方式获得具有有效记
→
PDF
9 years ago
NIPS
数据生成的序贯决策
本文探讨了一种基于顺序决策的生成模型及其在数据填充方面的应用,利用神经网络和引导策略搜索算法训练模型,在多个数据集上取得了有效结果。
PDF
9 years ago
Prev
Next