BriefGPT.xyz
Ask
alpha
关键词
optimal trajectories
搜索结果 - 3
高度混杂环境下,用于导航双轮机器人的可通过障碍感知路径规划算法
该文介绍了一种新颖的导航方法 —— Passable Obstacles Aware planner (POA),可帮助双轮机器人在高度混乱的环境中寻找穿越通道,降低路径长度和总旅行时间,并可嵌入到其他计划算法中。
PDF
a year ago
深度强化学习下的模型预测行动者 - 评论家算法:加速机器人技能获取
介绍了一种基于模型预测控制的混合模型学习和无模型学习方法,名为 MoPAC,通过探索 / 利用以减轻模型偏差,可以实现真实机器人的训练。该方法使用优化轨迹指导策略学习,并且在需要时进行探索。通过实验,MoPAC 方法优于当前最先进的方法,适
→
PDF
3 years ago
价值梯度强化学习
该研究介绍和发展了价值梯度的概念在强化学习中的应用,证明了学习价值梯度对于控制问题的效率明显优于仅学习价值,证明了价值梯度学习算法和策略梯度学习算法之间的一个惊人等价。通过在几个问题域中实验,发现使用价值梯度可以使效率提升几个数量级,从而不
→
PDF
16 years ago
Prev
Next