关键词guided policy search
搜索结果 - 5
  • 引导策略搜索作为近似镜像下降
    PDF8 years ago
  • 学习优化
    PDF8 years ago
  • 基于 MPC 引导的策略搜索学习自主飞行器深度控制策略
    PDF9 years ago
  • 使用连续内存状态学习深度神经网络策略
    PDF9 years ago
  • NIPS数据生成的序贯决策
    PDF9 years ago
Prev
Next