Oct, 2018

通过放大弱专家的能力来辅助强学习者

TL;DR本文介绍了一种名为迭代放大的训练策略,它通过组合解决较简单的子问题来有效地学习复杂行为,适用于包含难以明确目标的现实学习任务。