BriefGPT.xyz
Ask
alpha
关键词
aperiodic
搜索结果 - 2
Unichain 和非周期性对于渐近最优性的平均奖励厌恶赌博机是充分条件
我们研究了离散时间无限远平均回报的不安静赌博机问题,提出了一种新的策略类别,旨在将逐渐增大的一部分臂带向最优分布。我们证明了在 N 臂问题中,如果单臂松弛问题是单连通和非周期的,我们的策略是渐近最优的,具有 O (1/√N) 的最优性差距。
→
PDF
5 months ago
几何遍历马尔可夫链的半高斯集中不等式
若一个不可约的非周期马尔可夫链满足任何分别有界的静止链函数均满足与其平均值的适当亚高斯偏差不等式,则它是几何上遍历的。
PDF
10 years ago
Prev
Next