Jan, 2024

在遗憾匹配中平衡自我博弈训练中角色的人工智能强度

TL;DR通过引入 Regret Matching + 方法,训练一种通用模型来控制游戏中的任何角色,以实现人工智能在多角色游戏中的均衡性能。