BriefGPT.xyz
Ask
alpha
关键词
dsrl benchmark
搜索结果 - 1
离线多智能体强化学习与安全约束的扩散模型
最近在多智能体强化学习(MARL)的进展中,其应用已扩展到各种安全关键场景。然而,大多数方法专注于在线学习,在实际环境中部署时存在重大风险。为了解决这一挑战,我们引入了一个创新的框架,将扩散模型与 MARL 范式相结合。通过风险缓解来增强多
→
PDF
10 days ago
Prev
Next