IJCAIFeb, 2015

多智能体规划中具有乐观影响的本地价值 --- 扩展版

TL;DR本论文提出了一种影响 - 乐观上界策略,用于解决具有非因式价值函数的解离式部分可观察 MDP 的规模为数十甚至数百个代理的规划问题,并在数字上比较了不同的上界,并证明了启发式解法的优化保证,展示了该方法的多代理规划方面的潜在应用。