BriefGPT.xyz
Ask
alpha
关键词
lola
搜索结果 - 3
元值学习:具备学习认知能力的一般性学习框架
在多智能体系统中,基于梯度的学习很困难,LOLA 通过在一步优化中不同化来解决这个问题,我们通过扩展 LOLA 的思想并开发出一种完全通用的基于价值的优化方法,核心是一个称为元 - 价值的函数,它在联合策略空间的每个点为每个智能体给出折现未
→
PDF
a year ago
ICML
COLA: 具有对手感知的一致学习
通过在 LOLA 算法中引入一种方法称为 Consistent LOLA,其中学习更新功能在彼此影响时保持一致,作者在广义和游戏模型中进行了一系列实验,发现这种方法比 HOLA 和 LOLA 更容易收敛,并能够找到更加符合社会期望的解决方案
→
PDF
2 years ago
对抗学习感知的学习
LOLA 是一种用于多智能体学习的方法,在 agent 间显式地考虑其他 agent 的学习,以达到识别和利用合作的目的。
PDF
7 years ago
Prev
Next