Jun, 2021

隐空间中的基于模型的规划的时间预测编码

TL;DR本文使用时间预测编码等方法,构建了一种信息论方法的强化学习模型,可帮助解决高维度观测值与复杂背景的问题。