Jun, 2023

通过深度强化学习探究 Morris 水迷宫中的导航策略

TL;DR本研究使用 2D 模拟 Morris 水迷宫来训练深度强化学习代理程序,并自动分类了导航策略, 将人工智能的学习动力学与动物实验数据进行比较。通过开发环境特定的辅助任务来研究影响其有用性的因素, 最后研究了人工代理神经网络中激活的内部表征的发展,这些表征类似于老鼠大脑中发现的 place cells 和 head-direction cells,并且它们的存在与人工代理采用的导航策略有相关性。