BriefGPT.xyz
Aug, 2022
组合强化学习的范畴语义
Categorical semantics of compositional reinforcement learning
HTML
PDF
Georgios Bakirtzis, Michail Savvas, Ufuk Topcu
TL;DR
本文利用分类学的方法,构建了一个强化学习的可组合性框架,研究了分解问题为子任务并在这些任务上运用学习策略的方法。文章针对贝尔曼最优方程而研究在组合模型下的可行性,探讨使用一些纤维积和推出操作使得组合现象更明显,并且通过引入的zig-zag连线模拟了MDP中的连续式任务完成方式。
Abstract
reinforcement learning
(RL) often requires decomposing a problem into subtasks and composing learned behaviors on these tasks.
compositionality
in RL has the potential to create modular
→