Jul, 2024

通过对信息集进行采样高效训练不完全信息博弈的神经网络

TL;DR通过经验研究我们发现,在不完全信息游戏中,一个较小数量的不同状态样本比重复取样少量状态更为重要,以获得更大的回报。