ICMLJun, 2013

使用展开马尔可夫随机场合成未明确任务的操纵序列

TL;DR研究提出了一种基于 Markov 随机场(MRF)的动态规划策略,通过训练参数可以更好地适应不确定的人工环境,并且可以通过一系列原始动作或控制器来表达高水平任务,经过详细的实验验证,该方法可以成功地规划各种任务。