Jan, 2022

选择的悖论:在分层强化学习中使用注意力

TL;DR本文提出了一个注意机制来限制每个步骤的可用选项,通过学习 affordances 并进一步学习子目标选项,解决了层次强化学习中规划深度和分支因素的问题,并探讨了硬注意和软注意的作用,是一篇关于强化学习的研究论文。