BriefGPT.xyz
Ask
alpha
关键词
average cost
搜索结果 - 2
带 Borel 空间的马尔科夫决策过程的有限逼近的渐近最优性
本文针对局限于有限状态下的马尔可夫决策过程,对于包括折扣和平均成本标准在内的情况进行了研究,获得了近似最优策略,使用预处理步骤将操作空间有限近似,可以使用众所周知的算法计算近似最优政策。
PDF
9 years ago
大规模马尔可夫决策问题的线性规划
本文考虑了控制具有大状态空间的马尔可夫决策过程以最小化平均成本的问题,并使用线性规划和两种方法,即基于随机凸优化和基于约束采样的方法,将性能提高到与在低维策略类中的任何策略相比的最佳水平。
PDF
10 years ago
Prev
Next