Feb, 2019

世界发现模型

TL;DR本文介绍了一种名为 NDIGO 的神经差分信息增益优化自我监督发现模型,旨在利用现代人工智能技术建立一个能够自主发现其世界的代理工具。通过对一些受控的二维导航任务的实验,发现 NDIGO 在学习表示质量方面的表现优于现有的信息寻求方法,尤其是在存在白色或结构噪声的情况下,其他信息寻找方法还停留在噪声中,并没有真正发现其世界。