关键词dynamic programming
搜索结果 - 135
  • 基于深度 Galerkin 反馈法的智能体动力学最优控制
    PDF19 days ago
  • 似曾相识度量是最优传输距离,并且可以高效计算
    PDFa month ago
  • 分支:用于优化决策树的快速动态规划和分支限界算法
    PDFa month ago
  • 基于动态规划的模型预测控制和强化学习的统一框架
    PDFa month ago
  • 人类洞察与人工智能精确度的协调:共同推进知识图任务
    PDF2 months ago
  • 领域无关动态规划
    PDF5 months ago
  • AAAI最佳生存树:一种动态规划方法
    PDF6 months ago
  • 基于均值嵌入的分布式贝尔曼算子
    PDF7 months ago
  • 用信息解释来描述语言模型解码中的权衡特征
    PDF8 months ago
  • 马尔可夫决策过程中的超越平均回报
    PDF8 months ago
  • 最大独立集:动态规划自学习
    PDF8 months ago
  • 超越稳态:随机 Softmax 策略梯度方法的收敛分析
    PDF9 months ago
  • ACT:通过优势调节实现决策变换的动态规划赋能
    PDF10 months ago
  • 重复多单位按竞标付费拍卖中的学习
    PDFa year ago
  • 离线强化学习的预算对比实验
    PDFa year ago
  • 动作 - 状态依赖的动态模型选择
    PDFa year ago
  • 自主海洋养殖中最大化海藻生长的动态规划方法:应对不确定海洋洋流的未操纵系统导航
    PDFa year ago
  • 超越动态规划
    PDFa year ago
  • ICMLBNN-DP: 通过动态规划对贝叶斯神经网络进行鲁棒性认证
    PDFa year ago
  • ICML计算最优树集合
    PDFa year ago
Prev