关键词dynamic programming
搜索结果 - 138
  • 通过协调提升和动态规划解决多模型马尔可夫决策过程
    PDF19 days ago
  • 通过策略优化缩小对抗性和随机 MDP 之间的差距
    PDF19 days ago
  • ACL重新调谐:通过递归调谐克服大型语言模型的组合性限制
    PDF22 days ago
  • 基于深度 Galerkin 反馈法的智能体动力学最优控制
    PDFa month ago
  • 似曾相识度量是最优传输距离,并且可以高效计算
    PDF2 months ago
  • 分支:用于优化决策树的快速动态规划和分支限界算法
    PDF2 months ago
  • 基于动态规划的模型预测控制和强化学习的统一框架
    PDF2 months ago
  • 人类洞察与人工智能精确度的协调:共同推进知识图任务
    PDF2 months ago
  • 领域无关动态规划
    PDF6 months ago
  • AAAI最佳生存树:一种动态规划方法
    PDF7 months ago
  • 基于均值嵌入的分布式贝尔曼算子
    PDF8 months ago
  • 用信息解释来描述语言模型解码中的权衡特征
    PDF8 months ago
  • 马尔可夫决策过程中的超越平均回报
    PDF9 months ago
  • 最大独立集:动态规划自学习
    PDF9 months ago
  • 超越稳态:随机 Softmax 策略梯度方法的收敛分析
    PDF10 months ago
  • ACT:通过优势调节实现决策变换的动态规划赋能
    PDF10 months ago
  • 重复多单位按竞标付费拍卖中的学习
    PDFa year ago
  • 离线强化学习的预算对比实验
    PDFa year ago
  • 动作 - 状态依赖的动态模型选择
    PDFa year ago
  • 自主海洋养殖中最大化海藻生长的动态规划方法:应对不确定海洋洋流的未操纵系统导航
    PDFa year ago
Prev