Jun, 2020

使用 Monte-Carlo 方法的深度主动推理代理

TL;DR本文提出了一种建立在深度学习结构之上的主动推理智能体的神经架构,并使用多种形式的蒙特卡罗(MC)采样方法,从而使智能体在利用奖励进行任务时能够更加有效地学习环境动态和模拟未来状态转换。