关键词markov decision processes
搜索结果 - 336
  • 基于蒙特卡洛规划的约束马尔可夫决策过程的随机控制
    PDF9 days ago
  • 部分可观测马尔可夫决策过程中纯探索策略的局限性:观测信息熵的足够性
    PDF14 days ago
  • 约束强化学习的平均奖励目标:基于模型和无模型算法
    PDF15 days ago
  • 离散折扣马尔可夫决策过程中熵正则化误差的尖锐估计
    PDFa month ago
  • SaVeR: 基于表格型 MDP 的安全策略评估的最优数据收集策略
    PDFa month ago
  • 有限状态马尔可夫决策过程中的离线贝叶斯不确定性量化与后验值优化
    PDFa month ago
  • 元强化学习中的测试时后悔最小化
    PDFa month ago
  • 多项式逻辑函数近似的强化学习中的随机探索
    PDFa month ago
  • 在无先验知识的平均奖励马尔可夫决策过程中寻找良好的策略
    PDFa month ago
  • 高效的递归离策略强化学习需要一个上下文编码器特定的学习率
    PDFa month ago
  • 随机算法与 PAC 界限在连续空间逆向强化学习中的应用
    PDFa month ago
  • 利用强化学习处理非累计目标的决策过程
    PDFa month ago
  • 面向基于行动者和表格式马尔可夫决策的有原则实用策略梯度
    PDFa month ago
  • 马尔可夫决策过程中的联邦控制
    PDF2 months ago
  • IJCAI马尔可夫决策过程下基于分布式避障特性的认证策略验证与合成
    PDF2 months ago
  • 具有条件风险价值的鲁棒风险敏感强化学习
    PDF2 months ago
  • 在大规模状态空间中学习可行的反事实解释
    PDF2 months ago
  • 统计模型检验基础的改进
    PDF3 months ago
  • ICLR基于树搜索的随机执行延迟下的策略优化
    PDF3 months ago
  • 估计记录策略的双重稳健离线策略评估
    PDF3 months ago
Prev