IJCAIMay, 2021

常规决策过程中高效的 PAC 强化学习

TL;DR本文探讨了如何在正则决策流程中实现强化学习,并提出了在一组参数中可以 PAC - 学习这一流程的最优策略。