NIPSDec, 2018

采用循环胶囊网络实现状态表示学习

TL;DR本文提出了一种循环胶囊网络,通过预测智能体轨迹中的未来观测来学习紧凑而相关的状态表示,进而有效地解决复杂的强化学习任务。