Jan, 2019

课程学习中任务排序的优化框架

TL;DR本文研究了如何通过选择不同目标函数,使用课程学习在强化学习中优化任务序列,提高初始性能,减少探索过程中的次优动作,并发现更好的策略。