Jun, 2020

学习主动任务导向的探索策略,弥合模拟与现实之间的差距

TL;DR本文提出并分析了一种基于任务导向探索的框架,该框架通过在模拟环境中学习任务导向的探索策略来标识任务相关的系统参数,并将这些参数用于在现实世界中进行基于模型的轨迹优化。实验表明,任务导向的探索有助于在系统参数未知时,使基于模型的策略适应更好,从而实现更好的任务表现。