Feb, 2019

针对RDDL规划的大小无关神经网络转移

TL;DR本文提出了一种针对不同规模的RDDL MDP问题进行神经网络迁移学习的方法,其关键创新包括状态编码器和参数绑定的动作解码器,该方法在SysAdmin和Game Of Life领域具有卓越的性能表现。