Oct, 2019

基于能量模型的模型规范化计划

TL;DR本研究讨论利用学习到的动力学模型进行规划,并提出使用环境状态转换的能量估计来规范该模型以实现样本有效学习,结果表明该方法可以在几分钟的经验中实现具有竞争力表现的学习。