Feb, 2018

使用软Q学习平衡双人随机博弈

TL;DR本文将软Q-学习技术应用于随机博弈中的多智能体系统,实现可调的智能体策略,通过理论和实验贡献,证明了软Q-学习可以在各种不同类型的博弈中实现优异表现。