BriefGPT.xyz
Ask
alpha
关键词
good-for-mdps büchi automata
搜索结果 - 1
交替式好状态马尔可夫决策自动机
本研究发现,当使用好的 MDP Buchi 自动机来代替确定性 Rabin 自动机时,可以更好地将 omega-regular 目标使用于模型无关的强化学习中,并且使用 Streett 自动机所得到的交替好的 MDP 自动机,可以比最小的非
→
PDF
2 years ago
Prev
Next