BriefGPT.xyz
Ask
alpha
关键词
extended value iteration
搜索结果 - 2
使用线性函数逼近的多智能体拥塞成本最小化
该论文提出了一种多智能体强化学习算法以实现分散式的最小化拥塞成本,该算法使用线性函数逼近过渡概率和全局成本函数,通过一个多智能体扩展价值迭代子例程维护全局状态动作值的估计,并通过动态通信网络共享成本函数参数以保护隐私。
PDF
2 years ago
MM
已知和未知环境下随机最短路径问题的凸对偶
本文从凸优化的角度研究了已知和未知环境中的随机最短路径问题,回顾了已知参数情况下的结果,并通过不同的证明发展了理解。其后专注于未知参数情况,在此基础上研究了扩展值迭代算子,包括现有算子和定义了其他算子。本文表明了 EVI 算子与凸规划的关系
→
PDF
2 years ago
Prev
Next