Oct, 2011

学习随机领域的符号模型

TL;DR本文探讨发展在复杂世界中可以学习行动的代理程序的目标,并开发了一种概率关系计划规则表示,以紧凑地模拟有噪声,不确定性的行动效果,并展示了这种规则的有效学习方法。通过在简单规划领域和具有逼真物理的三维模拟块世界的实验,我们证明了这种学习算法使代理程序能够有效地模拟世界动态。