BriefGPT.xyz
Ask
alpha
关键词
hip-mdp
搜索结果 - 2
NIPS
基于隐含参数马尔可夫决策过程的强健高效迁移学习
我们引入了一个新的 HiP-MDP 隐藏参数马尔可夫决策过程的处理方式,它能够通过低维度的潜在嵌入来建模相关任务的家族。我们采用贝叶斯神经网络来替换原模型中的高斯过程,从而使推理更具可扩展性,我们正确地模拟了潜在参数和状态空间中的联合不确定
→
PDF
7 years ago
隐含参数的马尔科夫决策过程:半参数回归方法用于发现隐含任务参数
该论文介绍了一种名为隐藏参数马尔科夫决策过程 (HiP-MDP) 的框架,用于对控制应用中的不同动态系统进行参数化,并提出了一种半参数回归方法来学习其结构。在控制设置中,学习的 HiP-MDP 能够快速识别新任务实例的动态,使得智能体能够灵
→
PDF
11 years ago
Prev
Next