Dec, 2012
尝试的事情做得不太好:强化学习中的指示性表述
The Thing That We Tried Didn't Work Very Well : Deictic Representation in Reinforcement Learning
Sarah Finney, Natalia Gardiol, Leslie Pack Kaelbling, Tim Oates
TL;DR研究表明,使用 deictic representation 来代替 propositional representation 在强化学习方面可能是一种可行的选择,但本文的实验证明,这种方法在简单的 blocks-world domain 中会使学习效果变差,作者讨论了这个结果的可能原因,并提出了更有效地在物体领域中学习的策略。