BriefGPT.xyz
Ask
alpha
关键词
information-sharing
搜索结果 - 2
ICML
有限观测多智体强化学习与(准)效率:信息共享的福音
我们研究了部分可观察随机博弈的可证明多智能体强化学习 (MARL)。我们主张利用智能体之间的信息共享,在可观察性假设的情况下构建一个近似模型来规划近似均衡,并开发了一种具有统计和计算上拟效率的部分可观察 MARL 算法。
PDF
a year ago
稀疏线性动态单臂赌博问题的协作阈值套索算法
本文提出了一种用于解决多智能体稀疏背景下的上下文线性赌博问题的新方法,通过使用 Lasso 回归进行维度缩减、回归进行问题解决、结合特定过程和网络结构共享信息,达到降低通信成本、保证最小累计遗憾值的效果,并在合成和真实场景下验证了方法的有效
→
PDF
a year ago
Prev
Next