关键词optimal control policies
搜索结果 - 6
- 缩小差距:通过神经 ODE 优化引导和控制网络PDF2 months ago
- 面向任务驱动的探索,加速具有时态逻辑任务规范的深度强化学习PDF7 months ago
- 复杂和连续状态行动空间的专用深度残差策略安全强化学习控制器PDF9 months ago
- 非参数策略梯度算法在非平稳环境中的策略调整PDF2 years ago
- ICML雷电不会两次打中同一处:带有相互关联不确定性的稳健 MDPsPDF12 years ago
- 线性函数逼近与优先扫描的 Dyna-Style 规划PDF12 years ago
Prev
Next