May, 2023

有限认知负荷下的贝叶斯强化学习

TL;DR生物和人工智能在决策过程中都受到信息处理能力的限制,因此一般的自适应行为理论应该考虑代理的学习历史、决策和能力约束之间的复杂交互。最近的计算机科学研究开始通过强化学习、贝叶斯决策制定和速率失真理论中的思想来澄清这些动态的形成规律。这项研究成果提出了基于能力限制的贝叶斯强化学习的规范框架,用于模拟处理约束对学习和行动选择的影响。本文对这一领域的最新算法和理论结果进行了简明审视,特别关注如何将这些思想应用于认知和行为科学中的问题。