BriefGPT.xyz
Ask
alpha
关键词
stackelberg model
搜索结果 - 1
自动驾驶中的安全多智能体强化学习与双层优化
在自动驾驶应用中确保多智能体强化学习 (MARL) 的安全性是一个关键挑战。本研究提出了一种以随机均衡模型和双层优化为基础的安全 MARL 方法,并给出了收敛性分析。通过理论分析,我们开发了两种实用的算法:约束 Stackelberg Q
→
PDF
a month ago
Prev
Next