Jan, 2012

连续智能体环境系统的赋能

TL;DR本文将探讨如何将授权延伸到连续状态,并使用高斯过程回归进行模型学习和预测,研究 empowerment 在探索和在线模型学习方面的应用。