Mar, 2022

应用人工障碍实现自适应学习得到常规博弈的纳什均衡

TL;DR本文介绍了一种基于学习自动机(Learning Automata)和人工障碍的算法,可以有效解决纯策略下不存在鞍点时无法到达混合纳什均衡的问题,且可以应用于 $S$-Learning 环境中。