Mar, 2017

虚拟与现实:贝叶斯优化在强化学习中平衡模拟与实验

TL;DR本文提出了一种基于贝叶斯优化算法的方法,通过利用来自仿真的先验知识,自动将仿真数据和实验数据相结合以更有效地找到良好的控制策略,从而减少实验次数和成本。