Aug, 2022

组合强化学习的范畴语义

TL;DR本文利用分类学的方法,构建了一个强化学习的可组合性框架,研究了分解问题为子任务并在这些任务上运用学习策略的方法。文章针对贝尔曼最优方程而研究在组合模型下的可行性,探讨使用一些纤维积和推出操作使得组合现象更明显,并且通过引入的zig-zag连线模拟了MDP中的连续式任务完成方式。