BriefGPT.xyz
Ask
alpha
关键词
sampling setting
搜索结果 - 2
截断方差减小的值迭代
我们提供了一种更快的随机算法,用于在具有有限状态动作对、有界奖励和折扣因子的折扣马尔可夫决策过程中计算 ε- 最优策略。我们通过在采样设置和离线设置中提供不同的时间算法,进一步优化了之前的最先进技术。我们的方法基于先前的随机方差减少值迭代方
→
PDF
2 months ago
ICML
样本中的网络推断和影响最大化
本文提出一种基于采样的影响力最大化方法,对于给定的节点影响传播日志数据,采用新颖的网络推断方法,可以学习到网络结构和传播参数,避免网络结构和参数假设所带来的误差。相比以往的方法,本方法不需要最大似然估计和凸规划假设,可以在网络参数学习难度较
→
PDF
3 years ago
Prev
Next