BriefGPT.xyz
Ask
alpha
关键词
omega-regular objectives
搜索结果 - 4
在 MDPs 中用于 LTL 和 ω-regular 目标的 PAC 学习算法
引入了一个基于模型的近似正确(PAC)学习算法,用于解决马尔可夫决策过程中的 omega 正则目标。不同于之前的方法,该算法从系统的采样轨迹中学习,不需要对系统拓扑的先验知识。
PDF
9 months ago
交替式好状态马尔可夫决策自动机
本研究发现,当使用好的 MDP Buchi 自动机来代替确定性 Rabin 自动机时,可以更好地将 omega-regular 目标使用于模型无关的强化学习中,并且使用 Streett 自动机所得到的交替好的 MDP 自动机,可以比最小的非
→
PDF
2 years ago
部分可观察马尔可夫决策过程的定性分析
本文针对部分可观察 Markov 决策过程(POMDPs)和 ω 正则目标,研究了基于观测的策略,并解决了定性分析问题的计算复杂度和最优内存界限。
PDF
15 years ago
具有不完美信息的 Omega 正则博弈算法
本文研究了基于观察的策略在具有 ω- 正则目标的图上的两人回合制游戏中的应用。我们提出了计算状态集合的固定点算法,解决了玩家使用确定性和随机化观察策略进行游戏的问题。
PDF
17 years ago
Prev
Next