Jun, 2024

空间囚徒困境博弈中的状态 - 动作 - 奖励 - 状态 - 动作算法

TL;DR合作行为在人类社会和自然界中普遍存在,本研究使用强化学习中的 SARSA 算法来研究进化博弈论,评估其对合作率的影响。