BriefGPT.xyz
大模型
Ask
alpha
关键词
automata learning
搜索结果 - 2
连续随机动力学学习环境模型
通过深度强化学习、自动化学习和马尔可夫决策过程等技术,学习出由自主智能体控制的环境模型,以解决复杂环境下的控制问题,并在多个强化学习基准环境中验证了方法的有效性。
PDF
a year ago
IJCAI
非马尔科夫决策过程中 PAC 强化学习的马尔科夫抽象
本文提出了一种结合自动机学习和经典强化学习的算法,用于学习非马尔可夫决策流程中的马尔科夫抽象,并且证明该算法具有 PAC 保证。
PDF
2 years ago
Prev
Next