ICMLJan, 2017

通过状态近似抽象实现近似最优行为

TL;DR本研究探讨了使用状态抽象来减轻计划和强化学习算法中的组合爆炸问题。我们研究了近似状态抽象的理论保证和在各种环境中的有效性。结果表明,使用近似抽象可以减少任务复杂度和行为最优性的损失。