BriefGPT.xyz
Ask
alpha
关键词
mean embeddings
搜索结果 - 2
基于均值嵌入的分布式贝尔曼算子
我们提出了一个新颖的算法框架来进行分布式强化学习,基于学习回报分布的有限维均值嵌入。我们基于此框架推导出了几个新的动态规划和时间差分学习算法,提供了渐近收敛理论,并对算法在一套表格任务上的实证性能进行了研究。此外,我们展示了这种方法可以与深
→
PDF
7 months ago
群体系统的深度强化学习
提出了一种基于分布的平均嵌入(mean embeddings)状态表示法,适用于具有大量同质代理的群集系统;在深度多智能体强化学习中利用神经网络方式实现的平均嵌入表示法可实现最丰富的邻近智能体信息交换,促进更复杂的集体策略的发展。
PDF
6 years ago
Prev
Next