Dec, 2012

尝试的事情做得不太好:强化学习中的指示性表述

TL;DR研究表明,使用 deictic representation 来代替 propositional representation 在强化学习方面可能是一种可行的选择,但本文的实验证明,这种方法在简单的 blocks-world domain 中会使学习效果变差,作者讨论了这个结果的可能原因,并提出了更有效地在物体领域中学习的策略。