BriefGPT.xyz
Ask
alpha
关键词
primal
搜索结果 - 2
PRIMAL: 通过强化学习和模仿多智能体学习进行路径规划
该研究提出了 PRIMAL,一种新的多智能体路径规划框架,结合了强化学习和模仿学习,用于训练全分散策略,在部分可观测的环境中在线反应式规划路径,具有隐式协调性。该框架通过引入专家规划器的演示,细心的奖励重新塑造和环境抽样,扩展了以前我们在协
→
PDF
6 years ago
连续非线性资源分配问题的算法 —— 新实现和数值研究
本文对单一资源约束下连续可分可微凸资源分配问题进行了最新的整理与扩展,包括 20 多本书籍和文章;还对算法进行了改进,并对多种松弛(主元)和断点(对偶)算法进行了数值评估,得出算法较好的结论。
PDF
9 years ago
Prev
Next