BriefGPT.xyz
Ask
alpha
关键词
distributed setup
搜索结果 - 2
分布式 TD ($λ$) 的单次平均化方法在马尔可夫采样下应用
我们考虑一种分布式设置的强化学习,其中每个智能体都有相同的马尔可夫决策过程的副本,但是转移矩阵由每个智能体独立进行采样。我们表明在这个设置中,我们可以通过 ' 一次性平均 ' 的过程,使得 N 个智能体对策略进行 N 倍的速度加速,前提是目
→
PDF
4 months ago
分布式半监督稀疏统计推断
本研究旨在研究半监督稀疏统计推断在分布式环境中的应用,提出了一种高效的多轮分布式去偏估计方法,有效地整合了有标记和无标记的数据,并应用于 M-estimation 和广义线性模型等不同损失函数形式。通过模拟研究和真实数据应用,证明了这种方法
→
PDF
a year ago
Prev
Next