BriefGPT.xyz
Apr, 2022
使用位置细胞学习灵活奖励寻求行为的计算理论
A Computational Theory of Learning Flexible Reward-Seeking Behavior with Place Cells
HTML
PDF
Yuanxiang Gao
TL;DR
本文提出了一种计算理论,通过使用混合高斯分布模拟场所细胞的活动,并通过连续时间马尔科夫链的转移概率矩阵。通过学习环境与奖励的关联来提高老鼠行为的灵活性,实验结果表明,相较于深度Q网络处理的神经启发式强化学习算法,该理论可以显著提高老鼠学习效率和行为灵活性。
Abstract
An important open question in
computational neuroscience
is how various spatially tuned neurons, such as
place cells
, are used to support the learning of
→