BriefGPT.xyz
Ask
alpha
关键词
planning module
搜索结果 - 3
运用深度强化学习解决实际自动驾驶问题
使用深层强化学习训练神经网络来实现自动驾驶规划栈中的控制系统,不仅使模拟环境中的自动驾驶汽车能够在没有障碍物的情况下平稳、安全地行驶,在真实世界城市中也能表现出良好的泛化能力。
PDF
2 years ago
面向策略梯度方法的策略感知模型学习
本文研究了模型基强化学习中模型的学习,提出了基于 Policy-Aware Model Learning (PAML) 的带权损失函数来学习模型, 结果证明该方法在某些基准问题上表现良好。
PDF
4 years ago
价值迭代网络
文章介绍了价值迭代网络(VIN),它是一个内嵌有 “规划模块” 的全可微神经网络,可以学习规划和预测基于规划的推理,如强化学习策略,其中的关键是一种新颖的可微近似值迭代算法,可表示为卷积神经网络,并使用标准反向传播进行端到端训练。我们在离散
→
PDF
8 years ago
Prev
Next