Apr, 2022

使用位置细胞学习灵活奖励寻求行为的计算理论

TL;DR本文提出了一种计算理论,通过使用混合高斯分布模拟场所细胞的活动,并通过连续时间马尔科夫链的转移概率矩阵。通过学习环境与奖励的关联来提高老鼠行为的灵活性,实验结果表明,相较于深度Q网络处理的神经启发式强化学习算法,该理论可以显著提高老鼠学习效率和行为灵活性。