关键词factorial representations
搜索结果 - 2
- 离散阶乘表示作为目标条件强化学习的抽象
提出了一种称为 DGRL 的方法,该方法通过学习目标的阶乘表示,并通过离散化瓶颈进行处理,以更粗略的目标规范来解决在噪声和高维度输入空间中定义目标的挑战;实验证明应用离散化瓶颈可以提高目标条件下的 RL 设置的性能。
- 因子表示学习的归纳偏置调查
本综述介绍了各种鼓励学习算法发现阶乘表示的约束条件,并将其分为无监督和监督归纳偏置两类。同时,本文呈现了一种基于监督和无监督归纳偏置优势比较的框架,比较了各种与学习阶乘表示问题相关的模型。