ICLRFeb, 2018

使用工作流引导探索的 Web 界面上的强化学习

TL;DR使用演示进行探索约束的工作流引导探索算法提高了强化学习智能体在面向网络任务中的效率