May, 2021

Tesseract: 多智能体加强学习中的张量化演员

TL;DR本文提出了一种名为Tesseract的方法,通过使用低复杂度假设类准确地模拟与任务相关的代理相互作用,从而解决在多智能体强化学习中存在的行动空间过大问题,并通过 PAC 分析验证了 Tesseract-based 算法的样本效率及其适用于各种不同领域。