Jan, 2019

模型自由规划的研究

TL;DR通过模型自由的深度神经网络结构,套用归纳偏差这一概念,成功实现了能够规划的强化学习智能体,并在不同领域有着较高的泛化能力和高效性。