BriefGPT.xyz
Ask
alpha
关键词
regular decision processes
搜索结果 - 2
Omega 正则决策过程
引入一种新型的 omega-regular 决策过程 (ODPs),通过将其规约为有限 MDPs 上的字典序优化和学习,实现了对 ODPs 的优化和学习。
PDF
7 months ago
IJCAI
常规决策过程中高效的 PAC 强化学习
本文探讨了如何在正则决策流程中实现强化学习,并提出了在一组参数中可以 PAC - 学习这一流程的最优策略。
PDF
3 years ago
Prev
Next