Nov, 2018

神经预测信念表示

TL;DR本文探讨了使用现代神经网络结构学习信念表示的可能性,并使用一步帧预测和两个变体的对比预测编码作为目标函数来学习表示。我们发现,神经表示能够捕获到环境的信念信息,这有潜力在部分可观测领域中促进学习和规划的新进展。