Feb, 2018

使用软 Q 学习平衡双人随机博弈

TL;DR本文将软 Q - 学习技术应用于随机博弈中的多智能体系统,实现可调的智能体策略,通过理论和实验贡献,证明了软 Q - 学习可以在各种不同类型的博弈中实现优异表现。