Sep, 2013

多任务强化学习的样本复杂度

TL;DR介绍了一种新的多任务算法用于强化学习任务,该算法显着减少了探索的每个任务的样本复杂性,并保证不会出现负转移,与对应的单任务算法相比具有可比性。