ICLRJun, 2021

协作游戏的能量学习,及其在机器学习估值问题中的应用

TL;DR提出了一种基于能量的处理合作博弈问题的方法,通过变分推断模型进行一步固定点迭代,恢复出各种博弈论估价标准,并证明这些变分估价都满足一组博弈论公理,并在某些合成和实际的评估问题上实验表明所提出的变分索引具有更低的解耦误差和更好的估值性能。