ICLRApr, 2021

叙事元 RL 中的抽象和情境神经元出现

TL;DR该研究分析了 Ritter 等人(2018)引入的恢复机制,揭示了两类神经元,分别在代理的工作记忆(一个 epLSTM 细胞)和在 Harlow 视觉固定任务的叙事变体上进行训练时出现。具体而言,抽象神经元编码跨任务共享的知识,而情景神经元携带特定情景任务相关的信息。