BriefGPT.xyz
Ask
alpha
关键词
stochastic action sets
搜索结果 - 2
ICML
具备随机行动集和对抗性奖励的改进型睡眠赌博机
本文考虑了具有随机动作集和对抗回报的睡眠强盗问题,提出了一种新的受到 EXP3 启发的高效算法,并在每轮可用集合从一些未知的任意分布中产生的最普遍版本中提出了一个具有保证的高效算法。
PDF
4 years ago
随机动作集的规划与学习
研究了具有随机动作集的马尔可夫决策过程及其最优策略和值函数的性质,并针对不同情况提出了多项式时间的策略迭代和价值迭代方法。
PDF
6 years ago
Prev
Next