BriefGPT.xyz
Jan, 2013
SPUDD:使用决策图的随机计划
SPUDD: Stochastic Planning using Decision Diagrams
HTML
PDF
Jesse Hoey, Robert St-Aubin, Alan Hu, Craig Boutilier
TL;DR
本研究提出了一种基于代数决策图来表示价值函数和策略的Markov决策过程的值迭代算法,并将其应用于波西网络和ADDs表示的大规模MDPs中,相较于树形结构表示方式大幅降低了节点数量。
Abstract
markov decisions processes
(MDPs) are becoming increasing popular as models of decision theoretic
planning
. While traditional
dynamic programming
→