BriefGPT.xyz
Ask
alpha
关键词
transition model
搜索结果 - 6
目标类别分类的转换图属性
目标类别分类是一种混合分类和转换模型,其集成目标是将对象分配到所谓的目标或正常类别。
PDF
3 months ago
模型基强化学习中的 Stein 信息导向探索
本研究提出了一种基于转移模型的新型探索激励方法 STEERING,并通过内核化 Stein 差异度(KSD)计算与优化未知最优模型之间的积分概率度量(IPM),获得亚线性贝叶斯遗憾,比当前基于信息增益的模型强化学习算法表现更优。
PDF
a year ago
TRAIL: 近乎最优的次优数据模仿学习
本研究提出了一种利用离线数据集学习隐含动作空间和转换模型的训练目标,通过此目标实现提高下游模仿学习的样本效率,该目标可用于廉价的次优或非任务特异性轨迹数据集。TRAIL 算法是一种能够增加样本效率的模型,其能通过学习基于能量的转换模型,对动
→
PDF
3 years ago
走向模仿学习的基本极限
研究了在马尔可夫决策过程中,即使在给定数据集前提下,模仿专家政策的算法可能会存在次优性,并提出了一种基于最小距离函数的新算法,在确定性专家和已知转移模型的情况下,提高了最小极值速率。
PDF
4 years ago
AAAI
轨迹反馈的强化学习
本文提出了一种基于轨迹反馈的强化学习算法,通过加强措施而无需为每个状态 - 动作对提供奖励,旨在处理现实世界的环境下反馈不及时的问题,同时,我们还分析了此算法的性能并提供优化 - 汤普森采样方法来处理未知转移模型的情况。
PDF
4 years ago
基于随机模块转换模型的动态网络分析
本文提出了一种基于随机块模型思想的动态网络模型,不同于以往大多数的动态网络模型,它不对边级动态做出隐藏的马尔可夫假设,且采用了一种近似的推理方法,得到的结果能更好地复制真实社交网络数据中边的持续时间。
PDF
10 years ago
Prev
Next