Feb, 2023

学习在没有知识的情况下玩随机完全信息双人游戏

TL;DR本文将 Descent 框架从完全信息的两人博弈扩展至随机博弈领域,并探讨了两种方法的实现和效果,其中 Descent 的泛化在 EinStein wurfelt nicht! 游戏中取得了最佳效果,而通过确定性游戏的近似仍然取得了良好的结果,可见其在特定场景下可能会取得更好的效果。