ICLRJan, 2023

模块化后继特征逼近器的任务知识组合

TL;DR本文提出了一种新的神经网络结构 MSFA,这种结构通过模块化的方式发现了对预测有用的状态特征并学习了它们自己的预测表示形式,相比于传统的基准架构和模块化架构,MSFA 能够更好地泛化。