BriefGPT.xyz
Ask
alpha
关键词
markov decision theory
搜索结果 - 3
部分历史分享下的分散随机控制:一种共同信息方法
本研究提出了一种分散式随机控制的普适模型,称之为部分历史共享信息结构。在该模型中,每一时刻控制器都要分享他们的部分观察历史和控制历史。基于所有控制器共同知晓的信息,将分散式问题从一个协调者的角度重构为等价的集中式问题,并提出了一种解决这个等
→
PDF
12 years ago
通过边选择优化 PageRank
本文介绍了如何通过控制节点之间的边来优化 PageRank 的方法,其核心方法是基于线性规划和贪心算法,并且在给定互斥边的情况下,此问题是 NP 困难问题。
PDF
15 years ago
强化学习:一项调查
本论文从计算机科学的角度调查了强化学习领域,包括历史、现状和实践应用等方面,并重点探讨了强化学习中的中心问题,如平衡探索和利用、马尔可夫决策理论、延迟强化学习等。
PDF
28 years ago
Prev
Next